





(类 ) William J. Collins # 周期 i 
ae 7~ A Ixus | 


Data 
Structures 
and the 
Standard 
lemplate 
Library 





William J. Collins 





Data Structures and 
the Standard Template Library 


*) 机 械 工 业 出 版 社 


c China Machine Press 





NIT} 





本 书 讲述 了 数据 结构 的 基本 原理 及 其 实现 ， 并 使 用 了 C++ 作为 教学 语言 。 通 过 方法 接口 、 
示例 和 应 用 的 学 习 ， 引 导 学 生 逐 渐 理解 和 掌握 如 何 高 效 地 使 用 数据 结构 。 大 部 分 数据 结构 是 在 
标准 模板 库 (STL) 中 提供 的 。 本 书 还 详细 研究 了 这 些 STL 数 据 结构 的 规范 实现 ， 展 示 了 这 些 实 
现 的 高 效 和 简洁 性 。 为 了 深入 理解 实现 的 要 点 ， 还 对 其 中 几 个 数据 结构 的 不 同 实现 进行 了 测试 。 


贯穿 全 书 的 宗旨 是 鼓励 结合 实践 的 学 习 。 每 章 末 尾 的 编程 项 目 让 学 生 可 以 开发 并 实现 自己 
的 数据 结构 ， 或 者 是 扩展 、 应 用 这 一 章 中 介绍 的 数据 结构 。 可 选 的 实验 帮助 学 生 通 过 编程 巩固 
所 学 知识 。 | 
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e 本 书 配套 网 站 上 包含 了 实验 、 课 件 、 习 题解 答 等 等 。 网 站 地 址 是 www.mhhe.com/collins。 
e 每 个 实验 都 要 求学 生 进行 仔细 的 观察 、 推 测 和 检测 才能 得 出 结论 ， 能 够 鼓励 学 生 积极 主动 地 学 习 。 


e 书 中 还 精心 设计 了 许多 教学 提示 和 习题 。 
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数据 结构 一 直 是 计算 机 科学 专业 课程 的 核心 内 容 ， 它 是 信息 的 组 织 方式 。 对 于 相同 
的 算法 ， 用 不 同 的 数据 结构 表示 其 中 的 抽象 数据 类 型 会 造成 不 同 的 执行 效率 。 

本 书 从 面向 对 象 程序 设计 的 角度 ， 具 体 使 用 C++ 语 言 ， 讲 述 了 数据 结构 及 其 算法 。 
通过 对 方法 接口 、 示 例 和 应 用 的 学 习 ， 引 导 学 生 逐 渐 理 解 和 掌 担 如 何 高 效 地 使 用 数据 结构 。 

本 书 与 传统 数据 结构 教材 相 比 ， 除 了 保留 系统 、 全 面 的 风格 之 外 ， 还 具有 重视 与 实 
际 编程 结合 、 侧 重 标准 模板 库 的 实现 描述 等 特点 ; 并 配 有 丰富 的 习题 及 实验 ， 是 一 本 优 
秀 的 课堂 和 自学 参考 用 书 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭 旬 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 目 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公 司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 壕 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum ，Stroustrup ，Kernighan， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 歧 藏 。 大 理 石 纹 理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 | 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 襄 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 , “计算机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系列 组 成 
“全 美 经 典 学 习 指 导 系 列 ”。 为 了 保证 这 三 套 丛 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公 司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交通 大 学 、 中 国 
”人 民 大学、 北京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 淹 
北 工 学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 着 名 学 者 组 成 “专家 指导 委员 会 ”"， 为 我 们 提供 选 题 意见 和 出 版 监督 。 

这 三 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
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的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. I. T.，Stanford，U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵盖 了 程序 设计 、 数 据 结 构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语 言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 衰 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 党 而 人 室 。 | 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指 正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzedu@hzbook.com 
联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 ] 号 
邮政 编码 : 100037 
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数据 结构 一 直 是 计算 机 科学 专业 课程 的 核心 内 容 。 它 是 信息 的 组 织 方式 。 对 于 相同 的 算 
法 ， 用 不 同 的 数据 结构 表示 其 中 的 抽象 数据 类 型 会 造成 不 同 的 执行 效率 。 因 此 ， 对 数据 结构 
的 研究 一 直 是 计算 机 科技 工作 者 努力 的 方向 。 本 书 从 面向 对 象 程序 设计 语言 的 角度 讲述 数据 
结构 及 其 算法 ， 使 用 了 惠普 公司 提供 的 标准 模板 库 (STL) 作为 基础 ， 代 码 具有 简洁 性 和 高 
效率 的 特点 ， 有 很 重要 的 实践 意义 。 

在 教材 内 容 的 安排 上 ， 本 书 仍 按照 各 种 不 同 的 数据 结构 分 类 进行 系统 的 介绍 。 在 给 出 了 
面向 对 象 程序 设计 及 容器 类 的 一 般 概 念 之 后 ， 通 过 堆栈 、 队 列 、 树 等 常用 数据 结构 剖析 了 方 
法 接口 及 其 简单 的 应 用 。 随 着 C++ 的 广泛 应 用 ， 容 器 和 模板 也 越 来 越 受 到 编程 者 的 重视 。 以 
往 的 教材 虽然 也 详尽 地 介绍 了 各 种 数据 结构 ， 但 总 局 限于 理论 上 的 探讨 ;与 此 不 同 的 是 ， 本 
书 更 强调 标准 模板 库 的 使 用 ， 而 不 仅仅 是 一 般 的 结构 和 算法 。 在 介绍 每 种 结构 时 ， 都 尽 可 能 
地 融入 了 它 在 STL 中 的 表现 形式 和 接口 ， 这 样 就 较 好 地 解决 了 数据 结构 和 实际 编程 应 用 脱节 
的 问题 。 

本 书 与 传统 数据 结构 教材 相 比 ， 除 了 保留 系统 、 全 面 的 风格 之 外 ， 还 增加 了 以 下 的 新 
特点 : 

* 重视 数据 结构 与 实际 编程 的 结合 。 书 中 的 源 代码 都 使 用 C++ 语 言 编写 ， 并 进行 了 验证 ， 

更 方便 有 编程 需要 的 读者 理解 和 使 用 。 

e 侧重 STL。 书 中 提供 了 大 量 的 方法 接口 及 实例 分 析 。 

。 使 用 了 大 量 的 文本 和 图 表 进 行 辅助 说 明 。 

. 每 章 都 包含 了 章节 目标 及 丰富 的 习题 ， 对 了 解 学 习 要 求 和 进一步 深入 学 习 提 供 了 很 好 的 

SE. | 

对 于 学 习 和 了 解数 据 结构 的 本 、 专 科学 生 及 研究 生 而 言 ， 本 书 可 作为 他 们 的 教材 和 教 
学 参考 书 ; 而 对 于 编程 人 员 、 技 术 服务 人 员 以 及 程序 使 用 者 而 言 ， 本 书 也 是 一 本 很 好 的 参 
考 读物 。 

本 书 由 周 翔 翻译 ， 在 翻译 过 程 中 得 到 了 隋 立 恒 、 王 勇 等 的 帮助 。 由 于 本 书 的 内 容 新 ， 涉 
及 面 广 ， 加 之 译 者 水 平 有 限 ， 书 中 难免 会 存在 一 些 问题 ， 姑 请 读者 提出 批评 意见 。 


译 者 
2003 年 9 月 
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本 书 讲述 了 数据 结构 及 算法 。 实 现 语言 选用 了 C++， 这 适用 于 已 经 学 习 过 相关 基础 课程 的 
学 生 。 这 些 课程 并 不 一 定 是 面向 对 象 的 ， 但 应 当 覆 盖 基本 语句 和 数据 类 型 ， 比 如 数组 和 文件 
处 理 的 基础 。 


标准 模板 库 


本 书 的 显著 特点 是 其 依据 为 标准 模板 库 (STL) 一 一 这 个 库 由 惠普 公司 提供 。 使 用 这 种 方 
法 有 几 个 优点 。 首 先 ， 这些 代码 是 被 详尽 检测 过 的 ;其 次 ， 读 者 通过 本 书 有 机 会 学 习 到 以 前 
设 有 接触 过 的 专业 代码 ， 它 是 相当 高 效率 和 简洁 的 ; 第 三 ， 这 个 库 在 今后 的 课程 中 也 是 非常 
有 用 的 。 

大 多 数 情况 下 库 不 会 描述 数据 结构 的 实现 。 这 是 有 好 处 的 ， 我 们 可 以 将 注意 力 放 在 功能 
而 不 是 实现 细 证 上 。 关 于 这 些 类 的 定义 ， 可 以 参阅 惠普 研究 实验 室 的 Stepanov 等 人 的 原始 实 
现 (参见 Stepanov and Lee，1994)。 这 个 惠普 实现 是 作者 所 知 的 全 部 实现 的 基础 。 


考虑 过 的 其 他 实现 


与 标准 模板 库 的 惠普 实现 同样 重要 的 是 ， 本 书 不 是 只 关注 于 数据 结构 和 算法 的 基础 课程 。 
和 惠普 实现 不 同 的 方法 也 是 值得 考虑 的 。 例 如 ，list 类 的 实现 使 用 了 有 头 节 点 的 双向 链表 ， 它 
和 单 链表 以 及 有 头 尾 域 的 双向 链表 是 不 同 的 。 另 外 本 书 还 比较 了 不 同 实现 的 差异 。 当然 ， 还 
有 一 些 数 据 结 构 〈 像 图 ) 和 算法 RE) 是 不 在 标准 模板 库 里 的 。 

本 书 也 可 以 满足 数据 结构 和 算法 课程 的 基本 需要 : 让 学 生 练习 开发 他 们 自己 的 数据 结构 ， 
书 中 有 许多 编程 项 目 ， 它 们 的 数据 结构 要 么 是 从 头 创建 的 ， 要么 是 从 童 中 的 范例 扩展 而 来 的 。 
另外 还 有 一 些 项 目 ， RAREST RSE RUE EREE. 


标准 C++ 


所 有 的 代码 都 是 基于 ANSLUISO 标 准 C++ 的 , 并 且 在 Windows 平 台 (C++ Builder 和 Visual 
C++) Bone a G++) EMRE. e EE ROSE (不 ERRERA) Æ ANSI/ISO 
C++ 的 一 部 分 。 


教学 方法 的 特点 


本 书 有 几 个 特点 ， 这 些 可 以 改善 教学 者 的 教学 环境 以 及 学 生 的 学 习 环境 。 每 章 开头 都 给 
出 了 目标 ， 末 尾 至 少 给 出 一 个 主要 编程 任务 。 每 个 数据 结构 都 描述 得 很 详细 ， 每 个 方法 都 有 
一 个 前 置 条 件 和 后 置 条 件 。 另 外 ， 大 部 分 方法 都 给 出 了 调用 示例 以 及 调用 结果 。 

对 细节 问题 ， 特 别 是 标准 模板 库 的 惠普 实现 ， 进 行 了 认真 的 研究 ， 并 在 29 个 实验 中 得 到 
补充 。 参 阅 前 言 的 “实验 的 组 织 ” 部 分 可 以 了 解 更 多 关于 这 些 实验 的 信息 。 每 章 后 都 有 多 种 
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习题 ， 教 师 可 以 使 用 这 些 习题 的 答案 。 
辅助 材料 


所 有 的 辅助 材料 都 放 在 网 站 上 : www.mhhe.com/collins. 

网 站 为 学 生 提 供 了 下 列 信息 的 链接 : 

。 实验 的 观察 以 及 入 门 方法 。 

。 本文 开发 的 所 有 项 目的 源 代码 。 

: 项 目的 Applet， 它 有 一 个 很 强 的 可 视 化 组 件 。 

另外 ， 教 师 可 以 从 网 站 获取 下 列 信 息 : 

。 教 师 关 于 实验 的 选择 。 

。 每 章 的 PowerPoint 幻 灯 片 《大约 1500 张 幻灯 片 )。 

* 每 章 习 题 的 答案 ，PowerPoint 里 展示 的 习题 以 及 实验 的 答案 。 


章节 纲要 


第 1 章 介绍 了 作为 后 续 章 节 基 础 的 C++ 的 特点 。 大 部 分 材料 表现 的 都 是 面向 对 象 技术 : 类 ， 
继承 ， 构 造 器 ， 析 构 器 以 及 运算 符 的 重 载 。 通 过 实验 来 回顾 类 、 继 承 和 运算 符 的 重 载 。 

第 2 章 介绍 了 容器 类 以 及 和 容器 类 存储 相关 的 问题 。 顺序 存储 和 链 式 存储 都 需要 使 用 指针 。 
为 了 说 明 链 式 存 储 ， 创 建 了 一 个 单 链 表 类 。 这 个 过 分 简单 的 Linked 类 为 描述 标准 模板 库 的 几 
个 关键 特色 〈 如 模板 、 和 迭代 器 和 通用 型 算法 ) 提供 了 背景 。 相 关 的 实验 是 基于 指针 、 迭 代 器 、 
运算 符 重 载 和 通用 型 算法 的 。 

第 3 章 是 软件 工程 简介 ， 概 述 了 开发 软件 的 四 个 步骤 : 分 析 ， 设 计 ， 实 现 和 维护 。 使 用 统 
一 建 模 语言 (UML) 作为 设计 工具 来 描述 继承 、 复 合 和 聚合 。 贯 穿 后 续 章 节 的 大 0 表示 法 可 
用 于 脱离 环境 来 评估 方法 的 时 间 代价 。 本 章 还 探讨 了 带 驱动 器 的 运行 时 评估 和 计时 ， 而 且 每 
个 主题 都 对 应 一 个 实验 。 | 

第 4 章 讲述 了 递归 ， 它 将 重点 暂时 从 数据 结构 转移 到 算法 上 ATAM, dE IL EDU AR 
决 问题 的 一 般 技 术 。 并 采用 了 相同 的 BackTrack 类 ， 用 于 搜索 迷宫 、 在 棋盘 上 放置 八 个 皇后 
(使 她 们 不 能 互相 攻击 ) 等 应 用 ， 并 阐述 了 一 个 马 可 以 遍历 棋盘 上 的 每 个 空格 ， 而 且 每 个 空格 
只 经 过 一 次 。 其 他 的 递归 调用 ， 如 汉 诺 塔 游戏 和 生成 置换 ， 更 进一步 地 突出 了 递归 的 优雅 ， 
尤其 是 将 它 和 对 应 的 迭代 实现 相 比 较 时 。 在 后 面 的 章节 里 也 会 遇 到 递归 ， 特 别 是 快速 排序 法 
的 实现 和 二 又 树 的 定义 中 。 此 外 ， 对 每 个 专业 程序 员 而 言 ， 递 归 是 一 个 必 不 可 缺 的 工具 ，。 

在 第 5 章 里 ， 开 始 使 用 vector 和 deque 类 学 习 标 淮 模 板 库 。 向 量 是 一 个 灵巧 的 数组 : 自动 
调整 大 小 ， 并 配 有 方法 处 理 任 意 位 置 的 插入 和 删除 操作 。 而 且 ， 向 量 是 模板 化 的 ， 因 此 将 int 
类 型 元 素 插 人 int 类 型 向 量 的 方法 和 将 string 类 型 元 素 插入 string 类 型 向 量 的 方法 是 完全 相同 

的 。 设 计 过 程 从 vector 类 中 最 常用 方法 的 方法 接口 (前 置 条 件 ， 后 置 条 件 和 方法 头 ) 开始 ， 
然后 是 惠普 的 大 致 实现 和 实验 中 的 进一步 的 细节 。vector 类 的 应 用 、 高 精度 的 算法 是 公 钥 加 
密 算 靶 的 基础 。 这 个 应 用 在 实验 和 编程 项 目 里 进行 了 更 深层 次 的 研究 。 队 列 和 向 量 很 相似 ， 

至 少 从 数据 结构 的 角度 来 说 是 这 样 的 。 但 是 实现 细节 上 仍 有 较 大 区 别 ， 这 些 细微 差异 将 在 实 
验 里 探讨 。 | 


第 6 章 描述 了 ist 数据 结构 和 类 ， 它们 的 特征 是 ， 方法 花费 线性 时 间 进行 随机 括 入、 删除 和 
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检索 。 这 个 属性 迫使 它们 使 用 链表 迭代 器 : 遍历 list 对 象 ， 并 使 用 常数 时 间 的 方法 在 当前 位 置 
上 插入 、 删 除 和 检索 对 象 。 本 章 也 介绍 了 双 链 式 的 环 型 实现 ， 并 在 一 个 实验 中 介绍 了 其 他 细 
节 。 其 应 用 是 一 个 小 的 行 编辑 器 ， 这 很 适合 链表 和 迭代 器 。 在 编程 项 目 中 对 该 应 用 做 了 进一步 
的 扩展 。 还 有 关于 和 迭代 器 种 类 ， 以 及 向 量 、 双 端 队列 和 链表 的 运行 时 间 比 较 的 实验 。 

queue 和 stack 类 是 第 7 章 的 主题 。 这 两 个 类 都 是 容器 配 接 器 : 它们 采用 了 其 他 一 些 类 的 方 
法 接口 。 对 queue 和 stack 类 而 言 ， 缺 省 的 “其 他 ”类 都 是 deque 类 。 因 而 得 到 的 stack 和 queue 类 
的 方法 定义 都 是 单行 的 。 队 列 的 具体 应 用 一 一 计算 洗车 处 的 平均 等 待 时 间 ， 属 于 计算 机 仿真 
的 范畴 。stack 类 有 两 个 应 用 : 递归 的 实现 ， 以 及 中 组 到 后 缀 的 转换 。 后 一 个 应 用 在 实验 中 进 
行 了 扩展 ， 并 构成 了 “ 求 一 个 条 件 的 值 ”编程 项 目的 基础 。 

第 8 章 的 重点 是 一 般 的 二 叉 树 ， 特 别 是 折 半 查找 树 。 介 绍 了 二 叉 树 的 基本 特点 ; 这 些 对 理 
解 AVL 树 、 红 黑 树 、 堆 、 霍 夫 曼 树 和 决策 树 是 很 重要 的 。 折 半 查 找 树 类 是 红 黑 树 的 惠普 实现 
的 单 色 版 本 。 

第 9 章 中 考察 了 AVL 树 。 作 为 实现 重新 平衡 的 机 制 ， 介 绍 了 旋转 。 借 助 于 辈 波 纳 契 树 ， 确 
定 了 AVL 树 的 高 度 总 是 和 树 中 项 的 数量 成 对 数 关系 。AVLTree 类 不 是 标准 模板 库 的 组 成 部 分 ， 
但 是 包含 了 几 个 重要 的 特色 ， 如 函数 对 象 ; 还 对 该 难题 提供 了 后 续 的 实验 研究 。 除 了 erase 方 
法 (编程 项 目 9.1) 之 外 ， 整 个 类 都 得 到 了 实现 。AVL 树 的 应 用 是 一 个 简单 的 拼写 检查 器 。 

红 黑 树 在 第 10 章 中 进行 了 研究 。 仔 细 研 究 了 红 黑 树 中 的 插入 和 删除 算法 ， 并 且 提 供 了 相 
关 的 实验 。 红 黑 树 不 在 标准 模板 库 中 ， 但 是 它们 是 标准 模板 库 中 四 个 关联 容器 类 (set. map. 
multiset 和 multimap) 大 部 分 实现 的 基础 。 E TRR E, 每 个 项 只 由 一 个 键 组 成 ， 是 不 允许 
重复 键 的 。 多 集合 允许 重复 键 。 在 一 个 映射 里 ， 每 个 项 只 由 一 个 惟一 的 键 部 分 和 另 一 部 分 组 
成 。 多 映射 允许 重复 键 。 AREAS TEM (用 来 计算 全 nn 
及 有 关 四 个 关联 容器 类 的 实验 。 

第 1l 章 介绍 了 priority_queue 类 ， 即 另 一 个 容器 配 接 器 。 缺 省 使 用 的 是 vector 类 ， 但 幕后 还 
有 一 个 堆 ， 使 得 以 常数 平均 时 间 进 行 插入 ， 而 且 即 使 在 最 坏 情 况 下 ， 也 能 以 对 数 时 间 删 除 最 
高 优先 级 的 元 素 。 可 以 考虑 基于 list 或 基于 set 的 实现 。 它 的 应 用 是 在 数据 压缩 领域 ， 特 别 是 起 
SD: 给 定 一 个 文本 文件 ， 生 成 一 个 最 小 的 无 前 级 编码 。 编 程 项 目的 任务 是 将 编码 转换 
回 原来 的 文本 文件 。 实 验 将 公平 性 融 进 了 优先 队列 ， 这 样 即便 是 同 为 最 高 优先 级 的 项 ， 也 总 
是 先 处 理 在 优先 队列 中 汪 留 时 间 最 长 的 。 

排序 是 第 12 章 的 主题 。 开 发 了 基于 比较 的 排序 的 最 小 上 界 的 估算 ， 研究 了 四 种 ， 快速” 
HET: 树 排序 (多 集合 )， 堆 排序 (随机 访问 容器 )， 归 并 排序 (列表) 和 快速 排序 (随机 访 
问 容器 )。 本 章 的 实验 在 随机 产生 的 数值 上 比较 了 这 些 排序 方法 ， 编程 项 目 是 排序 姓名 和 社会 
保障 号 码 文件 。 

第 13 章 先 开始 复习 了 顺序 和 折 半 查找 ， 然 后 研究 了 散 列 。 通 常 ， 在 标准 C44 或 村 淮 并 村 
库 的 惠普 实现 中 都 不 支持 散 列 类 。 本 章 开发 了 一 个 hash_map 类 。 这 个 类 的 方法 接口 和 map 类 
的 是 相同 的 ， 除 了 插入 ， 删 除 或 查找 的 平均 时 间 花 费 是 常数 而 不 是 对 数 时 间 ! 应 用 包含 了 字 
符 表 的 创建 和 维护 ， 以 及 对 第 9 章 中 拼写 检查 器 应 用 的 修正 。 还 比较 了 链 式 散 列 和 开放 地 址 散 
列 ; 在 编程 项 目 中 进一步 探索 了 它们 的 不 同 。hash_map 类 的 速度 是 实验 的 主题 。 

第 14 章 介绍 了 最 常用 的 数据 结构 一 一 图 、 树 和 网 络 。 给 出 了 基本 算法 的 框架 ， 广度 优先 湛 
代 ， 深 度 优先 从 代 ， 连 通 性 ， 寻 找 最 小 生成 树 以 及 查找 两 个 顶点 间 的 最 短路 径 。 开 发 的 惟一 
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的 类 是 使 用 邻接 表 实 现 的 network 类 。 其 他 类 ( &nundirected. graphffllundirected network) 可 
以 直接 定义 为 network 类 的 子 类 。 在 实验 中 研究 了 货 郎 担 问题 ， 并 且 提 出 了 一 个 编程 项 目 ， 要 
求 完成 network 类 的 邻接 矩阵 版 本 。 本 章 还 提出 了 另 一 个 回 浏 应 用 ， 使 用 的 仍然 是 第 4 章 所 介 
23 WJ BackTrack2& , | 

每 一 章 都 对 应 一 个 相关 的 网 页 ， 其 中 包括 了 该 章 中 开发 的 所 有 程序 以 及 适 于 阐释 概念 的 
Applet. . | 


附录 


附录 1 包含 了 有 助 于 学 生理 解 书 中 数学 概念 的 背景 信息 。 累 加 符号 和 对 数 的 初步 性 质 是 最 
基本 的 ， 而 数学 归纳 原理 使 得 我 们 能 更 深 地 分 析 二 叉 树 和 开放 地 址 散 列 。 

string 类 是 附录 2 的 主题 。 这 个 功能 强大 的 类 是 标准 模板 库 的 一 个 重要 组 成 部 分 ， 并 使 得 
学 生 可 以 绕 开 乏 味 的 字符 数组 。 

多 态 性 是 一 个 指针 引用 对 象 层 次 中 不 同 对 象 的 能 力 ， 在 附录 3 中 进行 了 说 明 。 多 态 性 是 面 
门 对 象 编程 的 一 个 基本 特性 ， 但 被 归 和 人 了 附录 ， 因 为 它 并 不 是 介绍 数据 结构 和 算法 所 必需 的 
论题 。 


实验 的 组 织 
本 书 中 共 涉 及 到 29 个 网 络 实验 。 学 生 和 教师 可 以 访问 的 URL 是 : 


www.mhhe.com/collins 

实验 不 只 包含 了 基本 素材 ， 还 提供 了 对 文字 材料 的 补充 。 例 如 ， 在 研究 了 vector、deque 
和 list 类 之 后 ， 用 一 个 实验 对 这 三 个 类 进行 了 一 些 时 间 测 试 。 

实验 是 独立 的 ， 因 此 教师 可 以 很 灵活 地 指定 实验 。 可 以 将 它们 指定 为 : 

1) 闭卷 实验 | 

2) 开卷 实验 

3) 不 计 分 作业 

除了 能 明显 地 提高 学 习 积极 性 ， 这 些 实验 还 能 鼓励 学 生 运用 科学 的 方法 。 学 生 们 观察 到 
一 些 现 象 ， 如 标准 模板 库 的 list 类 的 组 织 。 然 后 阑 明 并 提交 一 个 关于 该 现象 的 假设 -以 及 他 
们 上 自己 的 代码 。 测 试 之 后 可 能 需要 修正 他 们 的 假设 ， 提 交 根 据 实验 得 到 的 最 终结 论 。 


Bill Collins 
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第 1 章 ”C++ 中 的 类 


这 是 一 本 关于 编程 的 书 : 重点 是 对 数据 结构 及 算法 的 理解 和 使 用 。C++ 标 准 模板 库 中 聚集 
了 大 量 的 数据 结构 和 算法 。 第 2~12 章 将 侧重 于 解释 什么 是 库 以 及 如 何 使 用 库 来 简化 编程 。 要 
想 使 用 这 些 信息 ， 必 须 先 熟悉 本 章 提 到 的 类 的 情况 。 有 些 类 是 读者 已 了 解 的 ， 有 些 则 可 能 是 
完全 陌生 的 。 所 有 这 些 ， 不 论 是 对 库 自身 还 是 对 如 何在 编程 中 使 用 库 而 言 ， 都 是 必须 的 。 


目标 


1) 理解 类 、 对 象 和 消息 的 基本 原理 。 
2) 比较 程序 开发 人 员 和 用 户 对 类 的 看 法 。 
3) 能 够 灵活 运用 数据 抽象 的 原理 ， 开 放 一 封闭 原理 ， 以 及 子 类 替换 规则 。 


1.1 类 


类 将 变量 和 操作 这 些 变量 的 函数 连接 了 起 来 。 

类 是 一 个 用 户 自 定 义 类 型 ， 它 由 一 些 变量 (KERROS) 和 操作 这 些 字段 的 函数 (PE 
方法 ) 组 成 。 类 将 静态 组 件 〈 字 段 ) 和 动态 组 件 (DE) 封装 在 一 个 实体 中 。 这 个 封装 技术 
改善 了 程序 的 模块 性 : 通过 隔离 类 和 程序 的 其 他 部 分 ， 可 以 更 容易 理解 和 修改 程序 。 

假设 现在 想 解决 一 些 问 题 ， 需 要 使 用 日 历 上 的 数据 。 如 果 没 有 现成 的 可 用 类 ， 那 么 就 创 
建 一 个 类 Date。 这 个 Date 类 将 由 一 个 或 更 多 的 字段 组 成 ， 用 来 存放 日 期 ， 还 需要 方法 操作 这 
些 字段 。 开 始 时 不 必 过 多 考虑 如 何 选 择 表 示 日 期 的 字段 ， 也 不 要 考虑 操作 这 些 字 段 的 方法 。 
因为 我 们 的 目的 是 使 用 Date， 所 以 首先 需要 确定 Date 类 的 职责 。 也 就 是 ， 这 个 类 和 希望 提供 给 
用 户 什么 ?假设 职责 是 : 

1) 给 定年 、 月 、 日 ， 构 造 一 个 日 期 。 

2) 从 日 期 中 读 出 年 、 月 、 日 。 

3) 判断 给 定 的 一 个 日 期 是 否 有 效 。 

4) 返回 给 定 日 期 之 后 的 下 一 个 日 期 。 

5) 返回 给 定 日 期 的 前 一 个 日 期 。 

6) 返回 给 定 日 期 是 星期 几 (如 星期 二 )。 

- T) 判断 给 定 日 期 是 否 在 某 些 日 期 之 前 。 

8) 以 年 、 月 、 日 的 形式 输出 一 个 日 期 ， 比 如 : 2004, 5, 10. 


1.1.1 方法 接口 
方法 接口 提供 给 用 户 有 关 方 法 的 全 部 信息 。 


日 ”此 边栏 的 页 码 为 该 书 原 书页 码 ， 与 书 末 索引 中 的 页 码 相 斜 应 。 | 
e tae 字段 ”也 可 称 为 数据 成 员 、 成 员 变 量 、 实 例 变量 或 属性 ; “方法 ”也 称 为 成 员 函 数 、 服 


[1]? 





2 Z1 


类 的 职责 都 被 精练 在 方法 接口 中 : 用 户 调 用 方法 时 需要 的 明确 信息 。 每 个 方法 接口 应 包 
含 三 个 部 分 : 一 个 前 置 条 件 ， 一 个 后 置 条 件 ， 一 个 以 分 号 结束 的 方法 涉 。 前 置 条 件 是 在 方法 
运行 前 假设 的 程序 状态 ， 后 置 条 件 是 在 保证 前 置 条 件 为 真 时 方法 运行 后 的 程序 状态 。 

例如 ， 下 面 给 出 了 isValid 方 法 的 方法 接口 : | 

/后 置 条 件 : 如 果 这 个 Date 是 合法 的 就 返回 真 : year 应 当 是 1800 到 2200 之 间 的 整数 ; 


// month 必 须 是 1 到 12 之 间 的 整数 : day 必 须 是 1 到 给 定年 给 定 月 的 天 数 之 
// 间 的 整数 ; 以 上 三 条 必须 同时 成 立 。 否 则 ， 将 返回 假 。 
bool isValid(); 





这 里 设 有 给 出 前 置 条 件 ， 因 为 调用 这 个 方法 前 程序 状态 无 须 特 别 限 定 。 从 技术 性 上 而 言 ， 
前 置 条 件 就 是 真 (ture)。 但 是 在 书写 时 可 以 省 略 。 每 个 方法 都 应 完成 一 定 的 功能 ， 因 此 总 是 
需要 明确 地 给 出 后 牌 条 件 。 为 了 并 明 后 置 条 件 里 的 “这 个 Date” 短 语 ， 需 要 先 定 义 术 语 “ 对 
BO", “Ce TA TR A Se Fea Fé ER BE EH 


1.1.2 对 象 


给 定 一 个 类 ， 对 象 《有 时 称 作 类 的 一 个 实例 ) 是 一 个 变量 ， 它 拥有 这 个 类 的 字段 并 可 以 
调用 这 个 类 的 方法 。 例 如 ， 如 果 定 义 : 


Date myDate; 
那么 myDate 是 一 个 Date 类 型 的 对 象 。 如 果 在 程序 后 面 编写 : 


if (myDate.isValid( )) 

cout << "The date is valid.": 
else 

cout << "The date is not valid.": 


这 表示 对 象 myDate 调 用 它 的 isValid 方 法 。 因 此 ，myDate 也 被 看 作 是 一 种 调用 对 象 一 一 调 
用 方法 的 对 象 。 

在 isValid 方 法 的 后 置 条 件 里 ， 短 语 “ 这 个 Date” 指 的 是 调用 对 象 。 因 此 根据 调用 对 象 的 
当前 值 返回 一 个 布尔 (bool) 值 。 例 如 ， 假 车 对 象 myDate 的 字段 的 值 分 别 是 5，17，2003，。 
那么 调用 | 

myDate.isValid() 

将 返回 真 。 但 是 如 果 myDate 的 字段 是 4，31，2003， 那 么 调用 
myDate.isValid() - 
将 返回 假 (false). 

通常 情况 下 ， 方 法 调用 名 的 组 成 是 一 个 对 象 、 后 跟 一 个 点 ， 然 后 是 方法 标识 符 ， 最 后 是 
Am SRR RBI. EMM HR, 消息 是 对 象 对 一 个 方法 的 调用 。 例 如 ， 
myDate.nextO 返 回调 用 对 象 日 期 的 下 一 个 日 期 。 在 这 个 消息 里 ， 对 象 myDate 调 用 了 Date 类 的 
next 方 法 。 术 语 “消息 ”是 指 程序 的 某 一 部 分 和 另外 部 分 的 通信 。 例 如 ， 消 息 thisDate next0) 
也 可 能 是 从 除了 Date 类 之 外 的 其 他 类 的 方法 发 送 的 。 

精练 Date 方 法 的 职责 后 可 以 得 到 下 面 的 方法 接口 : 


// 后 置 条 件 : 这 个 Date 由 month、day 和 year 构 成 
Date (int month, int day, int year); 
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注意 1.1.4 节 中 将 给 出 这 个 方法 的 说 明和 一 个 示范 消息 。 


// 后 置 条 件 : 用 读 入 的 month、day 和 year 设 置 这 个 Date 的 日 期 。 
void readinto(); 


示例 假设 有 下 列 程序 : 


Date lastDate; 
lastDate.readinto(); 


如 果 输 入 行 包含 
12 1 2003 ‘ 


那么 lastDate 的 字段 将 分 别 描述 日 期 2003 年 12 月 1 日 。 

// 后 置 条 件 : 如 果 这 个 Date 是 合法 的 就 返回 真 : year 应 当 是 1800 到 2200 之 间 的 
// 整 数 ; month 必 须 是 1 到 12 之 间 的 整数 : day 必 须 是 1 到 给 定年 给 定 月 的 天 数 之 
// 间 的 整数 ; 以 上 三 条 必须 同时 成 立 。 否 则 ， 将 返回 假 。 

bool isValid(); 


示例 ”假设 currentDate 是 类 Date 的 一 个 对 象 。 如 果 这 个 对 象 的 字段 的 值 分 别 是 2，29， 

2004， 那 么 currentDate.isValidO 将 返回 真 。 但 是 如 果 currentDate 的 字段 值 分 别 是 2 , 

29，2005 ， 那 么 currentDate.isValid() 将 返回 假 。 

IWER: 这 个 Date 是 有 效 的 。 

GRRE: 返回 这 个 Date 之 后 的 Date。 


Date next(); 


示例 ”假设 date 是 Date 类 的 一 个 对 象 。 如 果 对 象 的 字段 值 分 别 是 2000,2,29， 那 么 消息 
date.next(O 将 返回 值 2000.3,1。 如 果 date 中 是 一 个 无 效 值 ， 然 后 调用 date.next(O) 会 怎样 
E? 因为 无 效 日 期 不 符合 前 置 条 件 ， 所 以 无 法 定义 结果 。 也 就 是 ， 可 能 不 返回 日 期 ， 
也 可 能 返回 一 个 无 意义 的 日 期 ， 或 是 程序 错误 ， 等 等 。 类 的 用 户 有 义务 保证 在 调用 
方法 前 前 置 条 件 成 立 。 例 如 ， 用 户 可 以 按 如 下 方式 进行 


if (date.isValid( )) 
. . date.next( ) . . 
else 


cout << "Invalid date" << endl; 


INHER: 这 个 Date 是 有 效 的 。 
I NEST: 返回 这 个 Date 之 前 的 Date . 
Date previous(); 


HAER: 这 个 Date 是 有 效 的 。 
IRER: 返回 这 个 Date 是 星期 几 一 一 如 “星期 天 ”、“ 星 期 一 ”等 ， 
String dayOfWeek(): | | 


示例 ”假设 meetingDate 是 Date 类 的 一 个 对 象 ， 而 且 如 颗 对 象 的 字段 值 代表 日 期 2003 
年 6 月 12 日 ， 那 么 消息 





meetingDate.dayOfWeek() 

将 返回 “星期 四 。 

注意 string 类 是 ANSI 标 准 C++ 的 一 部 分 ， 因 此 在 正文 和 实验 中 都 可 以 自如 地 使 用 。 
附录 2 详细 地 解释 了 这 个 类 ; 如 果 读 者 不 台 炙 这 个 非常 重要 的 类 ， 请 现在 阅读 附录 。 
// 前 置 条 件 : 这 个 Date 和 otherDate 是 有 效 的 。 


(SERRE. 如 果 Date 在 otherDate 之 前 就 返回 真 。 和 否则， 返回 假 。 
bool isPriorTo (Date otherDate); | 


示例 ”假设 currentDate 是 Date 类 的 一 个 对 象 ， 它 的 字段 值 代表 2003 年 3 月 27 日 ， 
staftDate 也 是 Date 类 的 一 个 对 象 ， 它 的 字段 值 代表 2004 年 1 月 1 日 ,那么 


currentDate.isPriorTo (startDate) 


将 返回 真 。 

RRA: 这 个 Date 是 有 效 的 。 

HE: 将 Date 按 照 月 、 日 、 年 的 形式 输出 ，。 
void print(); 


示例 ”假设 newtDate 是 Date 类 的 一 个 对 象 ， 它 的 字段 值 代表 2003 年 1 月 28 日 3843 
newDate.print(); 


则 输出 
January 28, 2003 


类 的 这 个 观点 是 从 用 户 的 角度 出 发 ， 聚 焦 于 类 用 户 需要 的 信息 上 。1.1.3 节 将 着 眼 于 开发 
者 的 角度 ， 并 比较 这 两 种 方式 。 


1.1.3 数据 抽象 


数据 抽象 是 将 类 为 用 户 提 供 的 东西 和 类 的 定义 分 离开 。 

迄今 为 止 讨论 的 都 是 方法 接口 ， 也 就 是 类 为 编程 者 提供 了 什么 ， 而 不 是 类 的 字段 和 方法 
定义 一 一 即 类 是 如 何 定义 的 。 这 种 分 离 称 作 数 据 抽象 ， 分 离 中 的 “什么 ”和 “如 何 ” 是 面向 
对 象 编程 的 基本 特点 。 使 用 Date 类 的 编程 者 不 会 去 关心 数据 如 何 表示 或 者 方法 如 何 定义 。 字 
段 ， 也 就 是 日 期 的 表示 形式 ， 可 能 采用 下 面 的 一 个 形式 ， 也 可 能 采用 完全 不 同 的 形式 : 

int 字 段 描述 month、day 和 year: 比如 使 用 值 “2” 代 表 month,， “28” 代表 day，“2002” 
代表 year 

一 个 七 位 或 八 位 的 long 字 段 描述 theDate; 比如 使 用 值 “1042005” (代表 2005 年 1 月 4 日 ) 
At) “10042005” (代表 2005 年 10 月 4 日 ) 

用 一 个 长 度 为 8 的 字符 事 字 段 描述 theDate: 比如 使 用 值 “02282002” 

用 一 个 长 度 为 10 的 字符 囊 字 段 描 述 theDate: 比如 使 用 值 “02-28-2002” 

如 果 用 长 度 为 6 的 字符 串 字 段 表示 theDate 一 -比如 “022802”， 将 会 有 什么 错误 ? 

同样 ， 某 些 方法 可 能 需要 选择 方法 的 定义 。 例 如 ，isValid() 方 法 的 定义 可 能 使 用 一 个 
Switch 语 句 或 是 一 系列 的 else-if 语 句 : | 








if (month == 4 || month == 6 || month == 9 [| month == 11) 
return 30; // 30 days hath September, April, June and November 
else if (month == 1 || month == 3 || month == 5 || month == 7 || 
month == 8 || month == 10 || month == 12) 
return 31; // January, March, May, July, August, October, December 
else if (year % 4 != O || (year % 100 == 0 && year % 400 != 0)) 


return 28; // one year is slightly less than 365.25 days 
return 29; 


一 个 完整 的 面向 Date 类 的 项 目 (包括 Date 类 的 具体 实现 )， 可 以 从 本 书 网 站 的 源 代码 链接 
上 找到 。 

字段 和 方法 定义 的 实现 细节 让 人 在 开发 一 个 使 用 Date 类 的 类 时 分 心 。 可 能 其 他 一 些 人 已 
经 完成 了 Date 类 的 定义 ， 那 么 只 需 使 用 那个 Date 类 即 可 ， 而 不 必 再 做 额外 的 工作 。 但 即便 必 
须 独立 定义 Date 类 ， 也 可 以 把 它 推迟 到 使 用 Date 类 的 类 开发 工作 完成 之 后 再 进行 。 通 过 使 用 
Date 的 方法 接口 ， 可 以 增强 这 些 类 的 独立 性 : 只 要 不 修改 Date 的 方法 接口 ， 那 么 对 Date 类 的 
任何 修改 都 不 会 影响 这 些 类 的 有 效 性 。 

当 编 程 者 关注 类 提供 的 服务 而 不 是 类 的 实现 细 市 了 时， 就 已 经 应 用 了 数据 抽象 原理 : 


数据 抽象 原理 
用 户 的 代码 不 应 访问 他 所 使 用 的 类 的 实现 细节 。 | 


数据 抽象 原理 的 一 个 要 点 是 如 果 类 A 使 用 类 B， 那 么 类 A 的 方法 不 应 访问 类 B 的 字段 。 实 际 
上 ， 类 B 的 字段 只 应 被 类 B 的 方法 访问 。 例 如 ， 假 设 下 面 的 定义 是 在 Date 类 之 外 进行 的 : 

Date currentDate; 

那么 类 似 下 列 形式 的 表达 式 : 

currentDate.month 

是 对 数据 抽象 原理 的 违法 应 用 ， 因 为 Date 类 是 否 有 month 字 段 是 一 个 实现 细节 问题 。 即 使 
Date 类 有 一 个 month 字 段 ， 开 发 者 可 以 自由 地 修改 Date 类 ， 而 不 能 改变 方法 接口 。 例 如 ， 开 发 
者 可 以 将 Date 类 修改 为 只 包含 一 个 字段 : 

String theDate; 

数据 抽象 原理 有 利于 类 的 用 户 ， 因为 这 使 他 们 摆脱 了 对 类 的 实现 细节 的 依赖 性 。 当 然 ， 
这 么 说 是 基于 类 的 方法 接口 已 经 提供 了 用 户 所 需要 的 所 有 类 的 信息 。 一 个 类 的 开发 者 应 当 创 
建功 能 足够 强大 的 方法 ， 从 而 使 用 户 不 需要 借助 任何 实现 细节 。 这 个 功能 应 在 方法 接口 中 给 
出 清晰 、 明 确 的 说 明 。 | 

方法 的 前 置 条 件 和 后 后 置 条 件 是 在 开发 者 和 用 户 之 间 陷 式 净 约 的 一 一 部 分 。 契 约 的 规则 如 下 : 

如 果 方 法 的 用 户 在 调用 该 方法 前 保证 前 置 条 件 为 真 ， 那么 开发 潜 将 保证 在 方法 

执行 完毕 后 后 置 条 件 为 真 。 

综 上 所 述 ， 从 开发 者 角度 出 发 的 有 关 类 的 讨论 ， 类 是 由 字段 和 操作 这 些 字段 的 方法 定义 
组 成 的 。 从 用 户 角度 来 说 可 以 抽象 为 ， 类 是 由 方法 接口 组 成 的 。 

基本 上 ， 标 准 模板 库 是 被 完全 测试 过 的 类 的 集合 ， 这 些 类 在 多 种 应 用 中 都 是 有 实用 价值 
的 。 应 用 程序 和 大 部 分 指定 的 项 目 将 使 用 标准 模板 库 ， 因此 它们 只 依赖 于 方法 接口 ， 而 不 依 





赖 库 中 方法 的 定义 。 
1.1.4 构造 器 


C++ 人 允许 在 对 象 的 定义 中 包含 对 象 的 初始 化 ， 这 减轻 了 编程 者 必须 初始 化 对 象 的 负担 。 这 
个 定义 加 上 初始 化 的 机 制 就 是 构造 器 : 它 是 类 中 的 一 个 特殊 方法 ， 和 类 的 名 字 相 同 。 每 次 定 
义 类 的 对 象 ， 都 将 自动 调用 类 的 构造 器 。 例 如 ， 可 以 用 如 下 方式 构造 一 个 Date 对 象 : 

Date startDate (7,1,2003); 

这 个 语法 有 点 不 寻常 : 类 标识 符 后 面 跟着 对 象 标识 符 ， 再 后 面 是 一 对 圆 括 号 括 起 的 变 元 
列表 。 对 象 startDate 中 的 字段 现在 表示 日 期 “2003 年 7 月 1 日 ”。 这 个 构造 器 的 方法 定义 依赖 
于 Date 类 中 的 字段 。 例 如 ， 如 果 Date 类 有 int 型 字段 month、day 和 year， 那 么 可 以 进行 下 面 的 
定义 : 

Date (int monthln, int dayin, int yearln) 

{ 

month = monthin; 
day = dayln; 
year = yearin; 


}/3 个 参数 的 构造 器 


35h. An ZÉDateJE FU —^ ^ ERE: 
long theDate; 


PAM HE SUBE FUR — (MEN) 赋值 语句 : 

Date (int monthin, int dayln, int yearin) 

{ 

theDate= ( (monthin*100)+dayin)*10000+yearin: 

j/3 个 参数 的 构造 器 

该 讨论 产生 了 一 个 问题 如 果 不 用 这 个 构造 器 定义 一 个 对 象 会 发 生 什么 ”那么 Date 类 也 
必须 定义 一 个 0- 参 数 构造 器 。 例 如 ， 假 设 有 程序 段 : 

”Date today; // 注意 ， 在 today 后 面 没有 辆 括号 

today.readlnto(); 

在 这 个 示例 中 ， 调 用 了 一 个 0- 参 数 构造 器 一 一 即使 today 的 定义 后 面 没 有 圆 括号 。 例 如 ， 
如 果 Date 类 有 int 型 字段 month、day 和 year， 可 以 做 如 下 定义 : 


I 后 置 条 件 : 这 个 Date 对 象 被 初始 化 为 1800 年 1 月 1 日 
Date() // 注意 ， 这 里 是 需要 圆 括 号 的 
{ 


month=1; 

day=1; 

year=1800; 
MH/0- 参 数 构 造 器 


也 就 是 说 ， 这 个 构造 器 将 把 today 的 日 期 初始 化 为 1800 年 1 月 1 日 。 这 个 初始 化 值 将 在 调用 
readInto 方 法 之 后 被 覆盖 。 
缺 省 构造 器 就 是 不 带 参 数 的 构造 器 。 








如 果 一 个 类 没有 显 式 地 定义 任何 构造 器 怎么 办 ? 那么 将 由 编译 器 自动 生成 一 个 0- 参 数 构 
造 嚣 。 因 此 ，0- 参 数 构造 器 也 称 为 缺 省 构造 器 。 但 是 如 果 类 定义 了 任意 一 个 构造 器 ， 编 译 器 
都 不 再 生成 缺 省 构造 器 。 这 样 ， 除 了 一 个 构造 器 是 缺 省 构造 器 之 外 ， 类 的 每 个 实例 都 必须 用 
至 少 有 一 个 参数 的 构造 器 进行 定义 。 从 安全 的 角度 出 发 ， 当 定义 包含 任何 构造 器 的 类 时 ， 应 
当 显 式 地 定义 一 个 缺 省 构造 器 。1.1.9 节 阐述 了 使 用 这 个 预防 措施 的 另 一 个 原因 。 

一 个 构造 器 ， 不 管 有 没有 参数 ， 都 不 会 自动 初始 化 类 的 字段 ， 因 此 必须 显 式 地 写 出 代码 
初始 化 字段 ， 例 如 int 型 字段 。 例 外 的 情况 是 对 象 字段 ， 即 字段 的 类 型 自身 就 是 一 个 类 的 时 候 。 
对 象 字段 将 根据 那个 类 相应 的 构造 器 进行 初始 化 。 例 如 ， 假 设 一 个 Calendar 类 有 两 个 字段 : 

Date startDate, | 

endDate (12,31,2200); 

如 果 声 明 

Calendar calendar; 

那么 将 调用 Calendar 类 的 缺 省 构造 器 。 在 构造 器 运行 之 初 ，Calendar 的 对 象 calendar 的 
startDate 字 段 将 被 初始 化 为 日 期 1800 年 1 月 1 日 ， 而 endDate 字 段 将 被 初始 化 为 日 期 2200 年 12 月 
31H. 

1.1.5 市 使 用 其 他 范例 继续 讨论 方法 接口 、 方 法 定义 和 构造 器 。 


1.1.5 一 个 Employee 类 


在 这 个 范例 中 ， 创 建 一 个 名 为 Employee 的 类 ， 用 来 表示 一 个 公司 的 雇员 。 每 个 雇员 的 信 
息 由 雇员 姓名 和 薪水 总 额 组 成 。Employee 类 的 职责 是 : 

D 将 订 员 的 姓名 初始 化 为 空 字符 串 ， 薪 水 总 额 初 始 化 为 0.00。 

2) 读 人 一 个 雇员 的 姓名 和 薪水 总 额 。 

3) 判断 是 否 到 达 了 输入 结束 标记 (姓名 是 “*”， 薪 水 总 额 是 -1.00 )。 

4) 判断 一 个 雇员 的 薪水 总 额 是 否 大 于 其 他 雇员 的 薪水 总 额 。 

5) 获取 一 个 雇员 的 姓名 和 薪水 总 额 的 拷贝 。 

6) 输出 一 个 雇员 的 姓名 和 薪水 总 额 。 

根据 这 些 职责 ， 开 发 方法 接口 : 


"NUES 这 个 雇员 的 姓名 被 设置 成 空 字符 串 ， 薪 水 总 额 被 设置 成 0.00 
Employee(); 


HERR: 读 入 雇员 的 姓名 和 薪水 总 额 。 


void readinto(); 


MB SE: In Employee: KR IE EE UR. AM, ZAR. 


bool isSentinel() const; 


/后 置 条 件 : ts REmployeot HA RE ToherEmployeetSg 总 额 就 返回 
IR. BR, ERR. 


bool makesMoreThan (const Employee&otherEmployee) const; 


HARRE 这 个 Employee 包 含 了 对 otherEmployee 的 拷贝 








void getCopyOf (const Employee&otherEmployee); 


注意 返回 的 是 otherEmployee 的 另 一 个 副本 。 例 如 ， 假设 输入 包含 


Simth, John 100000.00 
Siddiqi, Amena 120000.00 


然后 运行 下 面 的 语句 : 
Employee oldEmployee, 
newEmployee; 


newEmployee.readinto( ); 
oldEmployee.getCopyOf (newEmployee); 
newEmployee.readinto( ); 


然后 在 第 一 次 调用 readinto 之 后 ， 得 到 : 


n 
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调用 getCopyOf 方 法 之 后 ， 得 到 : 


mM 
3. 
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(一 
© 
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Smith,John 100000.00 


// 后 置 条 件 : 输出 这 个 Employee 的 姓名 和 薪水 总 额 。 

void printOut() const; 

Employee 类 的 方法 接口 包含 了 使 用 该 类 的 编程 者 所 需要 的 所 有 信息 。 另 一 方面 ， 类 的 开 
发 者 必须 决定 需要 哪些 字段 ， 然 后 定义 方法 。 例 如 ， 开 发 者 可 能 决定 需要 两 个 字段 ， 雇员 的 
name (string 型 ) 和 grossPay (double 型 )。 方 法 头 和 字段 (以 及 字段 的 类 型 ) 组 成 了 一 个 类 


的 声明 。 


包含 类 的 声明 的 文件 称 作 头 文件 。 下 面 是 头 文件 employeel1.h， 它 包含 了 Employee 类 的 声 
BH | 
#ifndef EMPLOYEE 
#define EMPLOYEE 





#include <string> 
using namespace std; 


class Employee 


{ 
public: 


/后 置 条 件 : 这 个 雇员 的 姓名 被 设置 成 空 字符 串 ， 薪 水 总 额 被 设置 成 0.00。 
Employee(); 


HERRE 读 入 雇员 的 姓名 和 薪水 总 额 。 


void readinto(); 


I 后 置 条 件 : 如 果 Employee 包 含 结束 标记 就 返回 真 。 耕 则 ， 返 回 假 。 


bool isSentinel() const; 


/后 置 条 件 : 输出 这 个 Employee 的 姓名 和 薪水 总 额 。 
void printOut() const; 


/后 置 条 件 : 这 个 Employee 包 含 了 对 otherEmployee 的 拷贝 。 
void getCopyOf (const Employee&otherEmployee); 


/后 置 条 件 : 如 果 Employee 的 薪水 总 额 高 于 otherEmployee 的 薪水 总 额 就 返回 
IA. SU, BAR. 
bool makesMoreThan (const Employee&otherEmployee) const; 


private: 
string name; 
double grossPay; 


const static string EMPTY STRING; 
const static string NAME SENTINEL: 


const static double GROSS PAY. SENTINEL: 
}; // Employee 
#endif 


现在 仔细 地 看 一 下 这 个 文件 。 每 个 以 符号 "wn 47 头 的 行 代表 了 一 条 编译 器 指令 : 一 条 编 
EHE. uB Pf 

#ifndef EMPLOYEE 

define EMPLOYEE 


通知 编译 器 ， 如 果 标 识 符 EMPLOYEE 还 没有 在 这 个 项 目 中 定义 过 (if not defined), 354, 
就 定义 EMPLOYEE。 使 用 这 些 指令 的 原因 是 为 了 避免 重复 声明 一 个 标识 符 一 重 声明 标识 符 
惩 错误 的 。 因 此 ， 如 果 这 个 文件 一 一 特别 是 标识 符 EMPLOYEE 一 还 没有 被 编译 器 遇 到 ， 那 
么 将 编译 这 个 文件 。 否 则 ， 整 个 文件 中 所 有 通 向 

#endif 


的 路 径 都 将 被 编译 器 忽略 。 因 此 即使 项 目的 多 个 文件 里 包含 


#include "employeei.h" 
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也 不 会 发 生 重 复 声 明 的 情况 。 下 一 条 编译 指令 ， 

#include <string> 

X5 A Aia VE 2 TEI PRPS CPR R Estrin (PaaS HR [ix723E). HE 
在 需要 了 解 的 是 我 们 可 以 定义 一 个 string 对 象 ， 然 后 使 用 这 个 对 象 进行 读 、 写 、 赋 值 和 比较 。 
例如 ， 


string s; 

cin >> s; 

cout << s; 

S = "yes"; 

if (s < "wow") 
while (s != "end") 


if (s[0]>'m')W 如 果 s 的 0 位 置 的 字符 >'m' 


在 讨论 Employee 类 之 前 尚 需 讨论 论 它 的 多 个 特性 。 fa RE 
锌 归 类 到 称 作 std 的 名 字 空 间 中 。 使 用 指令 由 关键 字 using 和 namespace 以 及 一 个 给 定名 字 
间 组 成 。 特 别 是 ， 

using namespace std; 

JA ARTE a IEEE std FRA, A BN ox SRA Behe SLT B COLI 
string 标 识 符 ，string 仍 然 代 表 的 是 标准 模板 库 中 定义 的 类 。 

现在 可 以 讨论 Employee 类 了 。Employee 被 声明 成 一 个 类 一 一 class 是 一 个 关键 字 ， 它 有 六 
个 方法 、 两 个 字段 和 三 个 常量 标识 符 。 注 意 一 个 class (或 struct) 的 关闭 声明 之 后 必须 跟 一 
个 分 号 。 

方法 和 字段 (以 及 其 他 标识 符 ) 的 区 别 是 圆 括 号 ， 因 此 即使 方法 中 没有 形 参 也 不 能 省 略 
ies 

类 的 声明 还 有 一 些 显著 特点 : 

* 构造 器 

Employee(); 

IEA01.1.4 55 GR, 938 as A PB TE RA Re A A. MILLE 
定义 对 象 时 自动 完成 ， 如 

Employee bestPaid; 


构造 器 和 类 名 字 相 同 ， 并 且 设 有 返回 类 型 。 一 个 没有 参数 的 构造 器 称 作 缺 省 构造 器 ， 因 
为 如 采 不 定义 任何 构造 器 的 话 ，C++ 编 译 器 将 自动 提供 一 个 0- 参 数 构造 器 (这 只 是 为 了 使 类 位 
于 bestPaid 这 样 的 定义 合法 化 )。 

常量 引用 参数 既 保 证 了 歼 率 ， 又 保证 了 安全 性 。 

* 在 getCopyOf 方 法 中 ，otherEmployee 是 一 个 常量 引用 参数 。 作 为 一 个 由 & 说 明 的 引用 参 

” 数 ， 当 调用 方法 时 只 传送 相应 变 元 的 地 址 ， 因 此 对 这 个 变 元 不 做 任何 复制 工作 。 这 既 节 

省 了 时 间 又 节省 了 空间。 同样 ， 由 于 有 关键 字 const， 所 以 在 getCopyOf 方 法 中 修改 
otherEmployee 是 非法 的 。 这 保证 了 安全 性 一 一 相应 的 变 元 将 不 会 被 修改 。 

。 关键 字 const 还 出 现在 isSentinel、 PrintOut 和 makesMoreThan 的 方法 头 的 最 后 ， 它 保证 








了 这 些 方法 不 会 修改 调用 对 象 。 在 makesMoreThan 方 法 中 ， 参 数 otherEmployee 又 是 一 个 
常量 引用 和 参数。 

“注意 在 Employee 类 的 声明 里 ， 关 键 字 public 后 面 跟着 一 个 冒号 。 在 C++ 中 ， 一 个 类 的 不 
同 成 员 《〈 即 字段 、 常 量 和 方法 ) 可 以 拥有 不 同 的 保护 级 别 ， 它 指明 了 什么 样 的 代码 可 以 
访问 那些 特定 的 成 员 。 田 一 个 保护 级 是 用 private: 指示 的 (不 要 忘记 冒号 ! )。 这 个 保 
护 级 只 允许 类 的 方法 访问 成 员 。 如 果 不 指定 ， 那 么 缺 省 保护 级 就 是 private，。 

*。name 和 grossPay 字 段 都 是 Private ， 因 此 在 Employee 类 的 方法 之 外 不 能 访问 这 些 字段 。 

* EMPTY STRING, NAME_SENTINELAIGROSS_PAY_SENTINELEXMERIAG: 它 
们 应 用 在 Employee 类 的 所 有 实例 中 ， 而 不 只 是 某 个 单独 的 实例 上 。 这 说 明 应 该 只 有 一 个 
GROSS_PAY_SENTINEL 的 拷贝 ， 而 不 是 Employee 类 的 每 个 实例 都 有 一 个 拷贝 。 为 了 
说 明 这 是 “类 相关 ”而 不 是 “对 象 相关 ”的 ， 关 键 字 static 也 是 声明 的 一 部 分 。 常 量 的 
值 在 类 的 定义 里 提供 ， 这 在 1.1.6 节 中 有 进一步 的 叙述 。 


1.1.6 Employee 类 的 定义 


包含 类 的 定义 的 文件 称 作 源 文件 。 要 定义 类 ， 必 须 提 供 它 的 方法 和 类 常量 的 定义 。 方 法 
的 定义 是 一 个 完整 的 函数 : 头 和 体 。 下 面 是 源 文件 employeel.cpp， 它 包含 了 Employee 的 类 
定义 : 

#include <iostream> 


#include <iomanip>// 声 明 输 出 格式 化 的 对 象 
#include "employee1.h"// 声 明 Employee 类 


Employee::Employee( ) 

{ 
name = EMPTY STRING; 
grossPay = 0.00; 

) // default constructor 


void Employee::readinto( ) 
{ 
const string NAME_AND_PAY_PROMPT = 
| "Please enter a name and gross pay, to quit, enter "; 


cout << NAME AND PAY PROMPT << NAME SENTINEL << " " 
« GROSS PAY SENTINEL; 
cin > > name > > grossPay; 
) // readinto 


bool Employee::isSentinel( ) const 


{ 
if (name == NAME SENTINEL && grossPay == 


GROSS_PAY_SENTINEL) 
return true; 
return false; 
} # isSentinel 
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void Employee::printOut( ) const 
{ 


cout << name << " $" << setiosflags (ios::fixed) << setprecision (2) 
<< grossPay << endl; 
) // printOut 


void Employee::getCopyOf (const Employee& otherEmployee) 
{ 


name = otherEmployee.name; 
grossPay = otherEmployee.grossPay; 
) // getCopyOf 


bool Employee::makesMoreThan (const Employee& otherEmployee) const 


{ 
return grossPay > otherEmployee.grossPay; 
} / makesMoreThan 


const string Employee::EMPTY STRING = ""; // 这 里 没有 使 用 static 

const string Employee::NAME  SENTINEL = "*"; 

const double Employee::GROSS PAY SENTINEL = — 1.0; 

public 保 护 级 允许 在 代码 的 任意 部 分 进行 访问 。 一 个 类 的 方法 通常 都 使 用 public， 因 为 
这 些 方法 往往 是 在 使 用 类 时 我 们 希望 其 他 代码 部 分 调用 的 东西 。 对 Employee 对 象 而 言 ， 任 间 
代码 段 都 可 以 调用 构造 器 和 其 他 方法 : isSentinel, readInto. writeOut. getCopyOf 和 
makesMoreThan, 

为 了 将 类 的 方法 和 其 他 函数 区 分 开 ， 需 要 一 个 限定 词 。 限 定 词 由 类 的 名 字 及 随后 的 两 个 
(不 是 一 个 ) 冒号 组 成 。 因 此 ， 例 如 readInto 方 法 的 定义 开始 是 


void Employee::readInto() 


这 个 头 指出 readInto 是 Employee 类 的 一 个 方法 。 这 两 个 连续 的 冒号 被 称 作 作用 域 解析 运算 
符 : 左边 的 操作 数 是 类 ， 右 边 的 操作 数 是 这 个 类 的 成 员 。 作用 域 解析 运算 符 消除 了 readInto 标 
识 符 中 所 有 可 能 的 不 确定 性 ， 即 使 一 个 非 成 员 函 数 也 叫做 readInto， 或 者 文件 里 的 另 一 个 类 也 
有 一 个 readIinto 标 识 种 

注意 ， 一 个 类 常量 标识 符 的 定义 提供 了 它 自 身 的 值 。 作用 域 解 析 运 算 符 必须 被 包含 进去 ， 
但 关键 字 static 被 省 略 了 。 

在 一 个 方法 定义 中 ， 调用 对 象 的 字段 和 方法 不 用 类 标识 符 也 可 以 被 访问 。 因 此 ， 如 果 在 
方法 定义 中 一 个 字段 总 是 以 它 自身 出 现 ， 那么 这 个 字段 被 假定 成 调用 这 个 方法 的 对 象 的 一 个 
字段 。 当 然 ， 没 有 调用 对 象 时 类 常量 也 会 出 现 ， 但 那 是 因为 它们 是 和 类 关联 在 一 起 ， 而 不 是 
和 类 的 一 个 实例 相关 联 。 | 

Employee 类 的 用 户 对 这 些 实现 细节 不 感 兴趣 。 例 如 ， 假设 要 寻找 公司 中 薪水 最 高 的 雇员 。 
在 这 个 应 用 里 ， 使 用 Employee 来 开发 一 个 Company 类 。 Company 类 的 职责 是 构造 一 个 公司 ， 
并 寻找 输出 公司 中 薪水 最 高 的 雇员 ， 也 就 是 薪水 总 额 最 大 的 雇员 的 姓名 和 薪水 总 额 。 现 在 将 
这 些 职责 精炼 为 一 个 缺 省 构造 器 一 一 findBestPaid 和 printBestPaid 方 法 的 方 靶 接口 : 


// 后 置 条 件 : 这 个 Company 被 初始 化 。 
Company(); 








Ci 


// 后 置 条 件 : 找 出 这 个 Company 中 薪水 最 高 的 雇员 。 
void findBestPaid(); 


/后 置 条 件 : 输出 这 个 Company 的 薪水 最 高 的 雇员 。 
void printBestPaid() const; 


xx HiCompany7] i2; 8 875 LJ. JF 468 main pg Zt o 3: 1. 


St: Company 项 目 (所 有 实验 都 是 可 选 的 ) 


正如 1.1.3 节 中 发 现 的 一 样 ， 应 当 尽 可 能 地 使 用 已 有 的 类 。 如 果 一 个 类 拥有 这 个 应 用 所 需 
的 最 多 但 不 是 全 部 的 方法 怎么 办 ? 简单 的 方法 是 抛弃 这 个 类 再 开发 一 个 自己 的 类 ， 但 是 这 会 
浪费 时 间 ， 降 低 效率 。 另 一 个 选择 是 拷贝 类 中 需要 的 部 分 并 将 这 些 部 分 合并 到 我 们 开发 的 一 
个 新 的 类 中 。 这 种 选择 存在 的 危险 是 这 些 部 分 可 能 是 不 正确 的 或 者 是 效率 低 的 。 即 使 源 类 的 
开发 者 替换 了 这 些 不 正确 的 或 效率 低 的 代码 ， 我 们 的 类 仍然 是 错误 的 或 效率 低 的 。 比 较 好 的 
选择 是 使 用 1.1.7 节 中 讲述 的 继承 。 


1.1.7 继承 


编程 者 应 努力 编写 可 重用 软件 组 件 。 例 如 ， 定 义 一 个 函数 计算 10 个 数值 的 平均 数 ， 不 如 
定义 一 个 图 数 计算 任意 个 数值 的 平均 数 。 通 过 编写 可 重用 代码 ， 不 仅 节省 了 时 间 ， 而 且 避 免 
了 错误 地 修改 已 有 代码 的 带 在 危险 。 

继承 是 定义 一 个 新 的 类 ， 且 该 类 包含 已 有 类 的 全 部 字段 以 及 部 分 或 全 部 方法 的 能 力 。 

可 重用 性 可 以 应 用 在 类 上 ， 一 种 方式 是 通过 类 的 一 个 特殊 、 强 大 的 特性 一 一 继承 。 继 承 是 
定义 一 个 新 的 类 ， 且 该 类 包含 已 有 类 的 全 部 字段 以 及 部 分 或 全 部 方法 的 能 力 。 早 期 已 有 的 类 
称 作 超 类 、 基 类 或 者 祖先 类 。 新 的 类 (可 能 声明 了 新 的 字段 和 方法 ) ， 称 作 子 类 、 派 生 类 或 者 
子孙 类 。 一 个 子 类 也 可 以 通过 给 出 不 同 于 超 类 的 方法 定义 覆盖 超 类 中 已 有 的 方法 。 

为 了 解释 继承 是 如 何 发 挥 作用 的 ， 还 是 从 类 Employee 开 始 。 假 设 有 若干 应 用 使 用 了 
Employee。 一 个 新 的 应 用 涉及 到 查找 计时 工资 最 多 的 雇员 。 为 了 实现 这 个 应 用 ,输入 应 当 由 
雇员 姓名 、 工 作 的 小 时 数 〔int 型 ) 和 小 时 工资 (double 型 ) 组 成 。 薪 水 总 额 是 “小 时 数 x 小 
时 工资 ”。 

现在 可 以 改变 Employee， 给 它 已 添加 hoursWorked 和 payRate 字 段 并 修改 readInto 和 isSentinel 
方法 。 但 是 ， SE RELA CARE FAAS RAE Wo. 这 背后 的 
概念 是 众所周知 的 开放 一 封闭 原理 : 


开放 一 封闭 原理 
| FARME Hiir ERS RAR, 并 封闭 一 一 也 就 是 在 现 有 应 用 


中 保持 稳定 性 。 





具体 地 说 ，Employee 类 不 应 该 为 了 一 个 新 的 应 用 而 被 修改 。 不 用 重 写 Employee， 可 以 开 
发 HourlyEmployee 一 一 Employee 的 一 个 子 类 。 HourlyEmployee 的 每 个 对 象 将 保存 Employee 的 
信息 一 一 姓名 和 薪水 总 额 ， 以 及 工作 的 小 时 数 和 小 时 工资 。makesMoreThan、 getCopyOf 和 
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printOut 方 法 不 必修 改 ， 因 为 HourlyEmployee 类 的 对 象 可 以 像 Employee 的 对 象 一 样 调用 那些 方 
法 。 毕 竟 ， 一 个 计时 雇员 还 是 一 个 己 员 ! 下面 是 HourlyEmployee 版 本 的 readlInto 和 isSentinei 方 
法 的 接口 。 

// 后 置 条 件 : 读 入 这 个 HourlyEmployee 的 姓名 、 工 作 的 小 时 数 和 小 时 工资 ， 

/并 计算 出 薪水 总 额 。 


void readinto(); 


Ma SES TE: 如果 这 个 HourlyEmployee 包 含 了 结束 标记 就 返回 真 。 否则， 

// 返 回 假 。 

bool isSentinel() const; 

在 开始 HourlyEmployee 类 的 完整 的 声明 和 定义 之 前 ， 需 要 先 了 解 一 下 子 类 方法 是 如 何 访 
器 超 类 方法 的 。 | 


1.1.8 受 保 护 的 访问 


前 面 提 到 过 类 声明 中 的 缺 省 保护 级 是 private ， 而 且 可 以 访问 这 些 private 字 段 或 者 方法 的 
只 有 类 方法 自身 的 代码 。 具 体 来 说 ， 这 上 暗示 了 子 类 是 不 能 访问 这 些 private 字 段 或 方法 的 。 可 
以 令 这 些 字段 或 者 方法 是 public， 但 是 这 样 一 来 任何 代码 一 一 甚至 其 他 类 的 代码 一 一 都 可 以 访 
问 到 这 些 部 分 ， 而 这 可 能 是 我 们 所 不 希望 的 。 为 了 处 理子 类 的 代码 访问 情况 ， 可 以 使 用 
protected 保 护 级 。 | 

下 面 说 明了 protected 是 如 何 工作 的 。 假 设 x 是 一 个 成 员 一 一 也 就 是 说 是 类 A 的 一 个 字段 、 
常量 或 方法 。 如 果 在 x 的 声明 前 写 上 

protected: 

那么 A 的 任 一 个 方法 都 可 以 访问 x， 而 且 A 的 任意 子 类 的 任 一 一 个 方法 也 都 能 访问 到 x， 但 是 
其 他 的 代码 不 能 访问 x。 

由 于 希望 在 子 类 中 提高 可 重用 性 ， 所 以 通常 将 类 的 字段 和 类 常量 设置 成 protected 而 不 是 
private 访 问 。 因 此 ， 我 们 修改 了 Empioyee 的 类 声明 ， 将 字段 和 类 常量 设置 为 protected 而 不 
是 private 状 态 : 

#ifndef EMPLOYEE 

#define EMPLOYEE 

#include <string> 

using namespace std; 


class Employee 


( 
public: 


HARR 这 个 Employee 的 姓名 被 设置 成 空 字 符 串 ， 薪 水 总 额 被 设置 成 0.00 
Employee(); 


// 后 置 条 件 : 如 果 这 个 Employee 包 含 结束 标记 就 返回 真 。 否 则 ， 返回 假 。 
bool isSentinel() const; 








Cth SN. 


HERR: 读 入 这 个 Employee 的 姓名 和 薪水 总 额 。 


void readinto(); 


We BRE: 输出 这 个 Employee 的 姓名 和 薪水 总 额 。 


void printOut() const: 


IERRA. 这 个 Employee 包 含 了 对 otherEmployee 的 拷贝 。 
void getCopyOf (const Employee&otherEmployee); 


aR: 如 果 Employee 的 薪水 总 额 高 于 otherEmployee 的 薪水 总 额 就 返回 
i A. AM, RER. 


bool makesMoreThan (const Employee&otherEmployee) const; 
protected: 

string name; 

double grossPay; 


const static string EMPTY_STRING; 
const static string NAME_SENTINEL; 
const static double GROSS PAY. SENTINEL; 


}; // Employee 

#endif 

顺带 说 一 下 ， 对 Employee 类 的 这 个 改变 不 止 没有 违背 开放 一 封 闲 原 理 ， 而且 正 是 遵从 了 
这 个 原理 ， 因 此 Employee 类 可 以 合法 地 派生 子 类 。 

一 个 类 的 protected 成 员 只 能 被 该 类 和 它 的 子 类 的 方法 访问 。 

综 上 所 述 ， 限 制 最 严格 的 保护 级 是 private:， 它 只 能 被 类 的 方法 访问 。 稍 微弱 一 点 的 保护 
级 是 protected:， 它 只 能 被 类 和 它 的 子 类 的 方法 访问 。 限 制 最 松 的 保护 级 是 Public:， 它 可 以 
被 任何 代码 访问 。 

现在 再 转 回去 考虑 计时 雇员 的 开发 问题 。 


1.1.9 HourlyEmployee 类 


通常 情况 下 ， 子 类 的 声明 都 以 如 下 形式 开始 : 

class <subclass identifier>: public <superclass identifier> 

这 里 用 到 了 保留 字 public， 这 说 明 每 个 超 类 成 员 的 保护 级 决定 了 它 在 子 类 方法 中 的 可 访 
问 性 。 也 就 是 说 ， 超 类 的 public 和 protected 成 员 可 以 被 任意 子 类 方法 访问 ， 超 类 的 private 
成 员 在 子 类 方法 中 是 不 能 被 访问 的 。 

除了 这 个 特点 ， HourlyEmployee 类 声明 的 其 他 部 分 和 正常 类 声明 的 形式 是 相同 的 ， 并 且 
只 古 声 明 或 定义 了 子 类 中 新 的 字段 、 方 法 或 覆盖 的 方法 。 为 了 HourlyEmployee 的 潜在 子 类 ， 
将 字段 和 类 常量 都 设置 成 protected (而 不 是 private ) 状态 : 

ttifndef HOURLY EMPLOYEE 

#define HOURLY EMPLOYEE 


#include "employeet.h" 
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class HourlyEmployee : public Employee 


{ 
public: 


MERE: 这 个 HourlyEmployee 被 初始 化 。 
HourlyEmployee(); 


// 后 置 条 件 : 读 入 这 个 HourlyEmployee 的 姓名 、 工 作 的 小 时 数 和 小 时 工资 。 


void readinta(); 


// 后 置 条 件 : 如 果 读 入 了 结束 标记 就 返回 真 。 否 则 ， 返 回 假 。 


bool isSentinel() const; 


protected: 
int hoursWorked; 
double payRate; 


const static int HOURS WORKED SENTINEL; 
const static double PAY RATE SENTINEL:; 
}; // HourlyEmployee 


#endif 

Employee 类 的 name 和 8grossPay 字 段 会 怎么 样 呢 ? 它们 将 被 Employee 类 的 缺 省 构造 器 初始 
化 。 无 论 何 时 调用 任何 子 类 的 构造 器 ， 都 将 自动 调用 超 类 的 缺 省 构造 器 。 这 保证 了 至 少 所 
有 超 类 对 象 的 字段 将 被 正确 的 初始 化 。 

下 面 是 新 文件 hourlyEmployee2 .cpp: 


#include <iostream> 
#include "hourlyEmployee2.h" - 

^at 
HourlyEmployee::HourlyEmployee( ) { ) 


void HourlyEmployee::readinto( ) 


{ 
const string NAME_HOURS_RATE_PROMPT = 
_ "Please enter a name, hours worked and pay rate. The sentinels 


are ; 


cout << NAME_HOURS_RATE_PROMPT << NAME_SENTINEL << 


HO" 


<< HOURS WORKED SENTINEL << "" << 
PAY RATE SENTINEL << ": ": 


cin > > name > > hoursWorked > > payRate; 
grossPay = hoursWorked * payRate; 
) // readinto 


bool HourlyEmployee::isSentinel( ) const 
{ 
if (name == NAME_SENTINEL 


O ”如 果 超 类 至 少 定 又 了 一 个 构造 器 但 没有 缺 省 构造 器 ， 将 生成 一 个 编译 时 错误 信息 。 





&& hoursWorked == HOURS_WORKED_SENTINEL 
&& payRate == PAY_RATE_SENTINEL) 
return true; 
return false; 
) // isSentinel 


const int HourlyEmployee:: HOURS. WORKED. SENTINEL = —1; 

const double HourlyEmployee::PAY RATE, SENTINEL = - 1 .00; 

我 们 希望 找到 并 输出 公司 中 薪水 最 高 的 雇员 的 姓名 。 正 如 前 面 创 建 了 Employee 的 一 个 子 类 
HourlyEmployee 一 样 。 现 在 需要 创建 Company 的 一 个 子 类 Company2。 为 什么 ”这 是 因为 
Company 类 中 没有 提 及 HourlyEmployee。 可 以 很 容易 地 在 HourlyEmployee 的 用 户 Company 类 中 补 
救 这 个 问题 。 对 Company2 来 说 ， 所 有 的 问题 就 在 于 Hourly Employee 的 方法 接口 上 。Company2 
和 Company 只 有 一 点 不 同 : findBestPaid 方 法 被 覆盖 ， 因 为 这 个 方法 的 employee 对 象 定 义 为 

HourlyEmployee employee; 

而 不 是 

Employee employee; 

下 面 是 Company2 的 声明 : 

#ifndef COMPANY2 

#define COMPANY2 

#include "company1.h" 


class Company2 : public Company 


{ 


public: 
/ 后 置 条 件 : 求 出 薪水 总 额 最 高 的 计时 雇员 。 数 值 相同 的 
H 将 忽略 。 


void findBestPaid( ); 
y; // Company2 


#endif 


再 就 是 Company2 的 定义 : 
#inciude "company2.h" 

#include "hourlyEmpioyee2.h" 
void Company2::findBestPaid( ) 
{ 


HourlyEmployee employee; 


employee.readinto( ); 
if (lemployee.isSentinel( )) 
{ 
atLeastOneEmployee = true; 
while (!employee.isSentinel( )) 
{ 
If (employee.makesMoreThan (bestPaid)) 
bestPaid.getCopyOf (employee); 
employee.readinto( ); 


E 
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) // 输入 没有 以 结束 标记 开始 
) // findBestPaid 
这 个 方法 的 新 奇 之 处 在 于 行 
bestPaid.getCopyOf (employee); 
Employee 类 的 getCopyOf 方 法 没有 被 覆盖 ， 它 指定 的 形 参 类 型 是 Employee。 但 是 在 


| Company2 的 findBestPaid 定 义 中 调用 getCopyOf 方 法 时 ， 变 元 employee 是 HourlyEmployee 类 型 


的 ， 而 不 是 Employee 类 型 的 。 因 为 HourlyEmployee 是 Employee 的 一 个 子 类 ， 所 以 无 论 何 时 在 
一 个 表达 式 中 调用 Employee 对 象 ， 都 可 以 用 HourlyEmployee 对 象 替代 。 这 是 子 类 替换 规则 的 
一 个 应 用 : 


子 类 替换 规则 


无 论 何 时 在 一 个 表达 式 中 调用 一 个 超 类 对 象 ， 都 可 以 用 一 NF Kat RA. 





子 类 替换 规则 说 明 一 个 子 类 对 象 也 是 一 TESI. 例如 ， 一 个 HourlyEmployee 也 是 一 
个 Employee。 但 是 下 面 的 语句 是 非法 的 : 

employee = bestPaid;// 非 法 的 

这 个 赋值 语句 是 非法 的 ， 这 是 因为 一 个 Employee 不 必 是 一 个 HourlyEmployee。 这 里 不 能 
应 用 子 类 替换 规则 ， 因 为 赋值 语句 的 左边 必须 是 一 个 变量 ， 而 不 是 一 个 任意 的 表达 式 。 

实验 2 包含 了 关于 继承 的 更 多 的 细节 。 


实验 2: 关于 继承 的 更 多 的 细节 (所 有 实验 都 是 可 选 的 ) 


在 前 面 的 示例 中 ， 超 类 Employee 只 有 一 个 子 类 HourlyEmployee ; JF Company tt, RA — 
个 子 类 Company2。 某 些 情 况 下 ， 可 能 得 到 类 的 完整 的 层次 关系 。 例 如 ， 一 个 “ 流 ” 是 从 源 传 
送 到 目的 地 的 一 系列 信息 。 下 面 是 C++ 的 流 类 的 部 分 层次 : 


aN 





istream ostream 
Bud | 
ifstream iostream ofstream 


简单 地 说 ，ios 类 处 理 低层 的 输入 — 输出 ， 像 状态 位 和 相关 方法 : eofO. clear0 545. 
istream 类 在 ios 中 添加 了 提取 运算 符 operator>>， ostream 添 加 了 插入 运算 符 operator<<。 
ifstream 类 通过 增加 open 和 和 close 方法 扩展 了 istream 类 。 iostream 类 通过 为 istream 和 ostream 各 添 
加 一 个 专用 构造 器 扩展 了 它们 。 这 里 最 引 人 注 目的 是 iostream， 它 是 多 重 继承 的 一 个 范例 : 
iostream 是 两 个 基 类 一 一 istream 和 ostream 的 子 类 。 

读者 可 能 经 常会 遇 到 下 面 的 情况 。 在 开发 一 个 类 B 时 ， 发 现 其 他 一 些 类 A 的 方法 是 非常 有 





用 的 。 一 种 可 能 性 是 令 B 从 A 继承 ; 也 就 是 ，B 是 A 的 一 个 子 类 。 那 么 B 可 以 使 用 A 的 所 有 方法 。 
另 一 种 方案 是 在 类 B 中 定义 一 个 字段 ， 它 的 类 型 是 A。 那 么 可 以 通过 这 个 字段 调用 A 的 方法 。 
这 里 重要 的 是 要 领会 这 两 种 访问 类 A 的 方式 之 间 的 区 别 。 

继承 描述 了 “是 一 个 ”关系 。 一 个 HourlyEmployee 是 一 个 Employee。 一 个 iostream 是 一 个 
istream.. 下 面 的 说 法 也 是 正确 的 : 一 个 istream 是 一 个 ios， 因 此 一 个 iostream 是 一 个 ios。 从 数 
学 的 角度 来 说 ， 是 一 个 关系 是 传递 的 。 

男 一 方面 ， 类 中 的 字段 组 成 了 类 的 “有 一 个 ”关系 。 例 如 ，Employee 类 的 name 字 段 是 
string 类 型 的 ， 因 此 可 以 说 一 个 Employee 有 一 个 string。 同 样 ，Company 类 的 bestPaid 字 段 是 
Employee 类 型 的 ， 因 此 可 以 说 一 个 Company 有 一 个 Employee。 

一 般 说 来 ， 如 果 类 B 分 享 了 A 的 全 部 功能 ， 那 么 B 从 A 继承 是 更 好 的 选择 。 但 是 如 果 B 中 只 
有 一 个 组 件 能 从 A 的 方法 中 受益 ， 那 么 比较 好 的 选择 是 将 类 A 的 一 个 对 象 作 为 类 B 的 一 个 字段 ， 
这 个 对 象 可 以 调用 类 A 的 有 关 方 法 。 通 常 ， 选 择 不 一 定 是 非常 清晰 明确 的 ， 这 时 经 验 将 是 最 好 
的 同 导 。 | 

使 用 面 癌 对 象 方 法 时 ， 并 不 强调 程序 的 整体 开发 ， 而 是 强调 开发 模块 化 的 程序 部 件 ， 即 
类 。 这 些 类 不 仅 使 程序 更 容易 理解 和 维护 ， 而 且 在 其 他 程序 中 也 可 重用 。 这 种 方法 更 深 一 层 
的 优点 在 于 一 个 类 的 决策 很 容易 修改 。 首 先决 定 需要 什么 样 的 类 ; 且 因 为 每 个 类 和 其 他 类 之 
间 通 过 方法 接 日 互相 影响 ， 所 以 可 以 随心 所 欲 地 修改 类 的 字段 和 方法 的 定义 一 一 只 要 方法 接 
口 保持 不 变 就 可 以 | 

1.1.10 f: rp RHE T C89 — TP BRI RU RAE, WKH ARE: 定义 容易 记忆 的 运算 符 ， 而 
不 是 容易 忘记 或 易 拼 错 的 方法 标识 符 。 


1.1.10 运算 符 的 重 载 


方法 标识 符 带 来 了 一 个 小 麻烦 ， 就 是 和 通用 运算 符 相 比 ， 它 们 需要 特殊 的 名 字 。 例 如 ， 
在 Employee 类 中 ， 使 用 方法 标识 符 readInto 代 替 了 插入 运算 符 operator>>。C++ 人 允许 用 户 使 用 
运算 符 取代 方法 标识 符 ， 也 就 是 说 ， 可 以 在 某 一 类 中 将 运算 符 的 意义 扩展 到 一 个 方法 。 技 术 
性 的 术语 称 之 为 运算 符 重 载 : 给 一 个 现 有 的 运算 符 赋予 另外 的 意义 。 实 际 上 ， 运 算 符 重 载 的 
例子 是 很 常见 的 。 比 如 ， 运算 符 + 当 操 作 数 都 是 int 型 时 就 进行 整数 加 法 ， 当 都 是 float 型 时 就 
进行 浮 点 加 法 ， 如 果 操 作 数 都 是 string 对 象 就 进行 连接 操作 。 

为 了 说 明 类 中 运算 符 的 重 载 ,， RUN TRA. 这 里 是 Employees 关中 重 裁 operator> 
的 声明 : 


IN STE: 如 果 这 个 Employee 的 某 水 总 额 高 于 otherEmployee 的 薪水 总 额 就 返回 
Wm. BU, BAR. 


bool operator> (const Employee& otherEmployee) const; 


这 个 声明 和 1.1 5 市 中 makesMoreThan 方 法 的 声明 是 完全 相同 的 ， 除了 方法 标识 
makesMoreThan 被 替换 成 了 

operator> 

注意 Operator 是 关键 字 。 

从 这 个 声明 中 不 难 推断 定义 如 下 : 


bool Employee::operator> (const Employee& otherEmployee) const 














0 


{ 


return grossPay>otherEmployee.grossPay; 
WE 
现在 operator> 代 替 了 makesMoreThan 方 法 ， 因 此 表达 式 


employee.makesMoreThan (bestPaid) 


RRRA 


employee>bestPaid 


通常 ， 当 一 个 方法 被 一 个 运算 符 取 代 时 ， 调 用 对 象 ( 如 employee) 成 为 运算 符 左 边 的 操 
作 数 。 方 法 的 变 元 (如 bestPaid) 成 为 运算 符 右边 的 操作 数 。 运 算 符 = 的 重 载 和 运算 符 > 的 重 载 
非常 相似 。 细 节 问 题 参阅 实验 3。 
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现在 来 处 理 运算 符 << 的 重 载 。 但 是 这 个 运算 符 是 在 ostream 类 中 定义 的 ， 而 不 是 在 
Employee 类 中 定义 的 。 因 此 难点 是 必须 允许 运算 符 << 访 问 Employee 类 中 的 字段 。 实 现 这 个 目 
标的 一 种 方法 是 将 这 些 字段 设置 成 public 来 代替 protected。 但 是 这 样 将 使 每 个 用 户 都 能 访问 
到 这 些 字段 ， 那 么 用 户 和 Employee 类 的 具体 实现 之 间 就 连接 得 过 于 紧密 了 。 

我 们 所 和 希望 的 是 一 个 折 中 的 办 法 ， 既 保持 Employee 字 段 的 protected 状 态 ， 又 令 它 可 以 
被 ostream 类 中 的 对 象 ( 如 cout) 访问 到 。C++ 提 供 了 一 个 解决 方案 9 ， 称 作 友 元 声明 。 在 
Employee 的 声明 中 ， 关 键 字 friend 指 示 operator<< 是 Employee 的 一 个 “ 友 元 ”。 给 定 两 个 类 A 
和 B， 如 有 果 类 A 的 方法 m 被 允许 访问 类 B 的 所 有 成 员 (public、private 或 protected)， 那 么 方法 m 
是 类 B 的 友 元 。 为 了 满足 这 个 条 件 ， 类 B 也 必须 声 明 为 类 A 的 方法 m 的 友 元 。 下 面 是 文件 
employee3.h 中 将 operator<< 声 明成 Employee 类 的 友 元 的 代码 : 

friend ostream& operator<< (ostream& stream, 

const Employee& employee); 

这 个 重 载 版 本 的 运算 符 << 返 回 了 对 一 个 ostream (也 就 是 输出 流 ) 对 象 的 引用 ， 因 此 
employee3.cpp 中 运算 符 << 的 定义 是 : | 

ostream& operator « (ostream& stream, const Employee& employee) 


{ 
cout << employee.name << " $" << setiosflags(ios::fixed) 
<< setprecision (2) << employee.grossPay << endl: 
return stream; | 


V/ li S e 


因为 运算 符 << 被 声 明成 Employee 类 的 友 元 ， 所 以 该 运算 符 的 定义 允许 访问 Employee 的 
name 和 grossPay 字 段 。 | 

Jifroperator««pE.22 96 € dy f, TEL EAR "sfindBestPaidO, 将 

bestPaid.printOut(); 


日 可 以 说 ， C++ 的 主要 问题 就 是 它 为 每 个 问题 都 提供 了 一 一 种 解决 方案 ! 这 使 得 它 是 一 个 功能 强大 ， 但 是 很 难 
掌 提 的 语言 。 





替换 成 

cout<<bestPaid; 

注意 在 findBestPaidO 中 书写 语句 

cout<<bestPaid.name<< "$" <<bestPaid.grossPay; 

是 不 合法 的 ， 因 为 并 没有 人 允许 findBestPaid() 访 问 Employee 的 字段 。 换 句 话 说 ， 
findBestPaid() 不 是 Employee 的 友 元 。 如 果 想 使 用 这 个 语句 ， 必 须 把 findBestPaid0O) 设 置 成 
Employee 的 友 元 。 实 际 上 ， 可 以 通过 在 employee. h 中 进行 声明 将 整个 Company 设 置 成 
Employee 的 友 元 。 

friend class Company; /需要 关键 字 "class" 说 明 友 元 是 一 个 类 

那么 Company 类 的 findBestPaid0 和 printBestPaid() 方 法 将 可 以 访问 Employee 类 的 所 有 成 
员 。 注 意 友 元 关系 不 是 一 个 对 称 的 关系 : 这 个 声明 使 得 Company 成 为 Employee 的 友 元 ， 但 没 
有 令 Employee 成 为 Company 的 友 元 。 因 此 Employee 类 不 能 访问 Company 类 的 非 公 有 (没有 设 
为 public ) 成 员 。 | 

除了 成 为 友 元 ， 在 运算 符 << 的 声明 中 还 有 一 个 有 趣 的 地 方 : 返回 值 是 一 个 ostream 对 象 的 
引用 。 这 是 值得 关注 的 ， 因 为 cout 自 身 就 是 一 个 ostream 对 象 。 因 此 可 以 在 同一 个 语句 中 多 次 
使 用 运算 符 <<。 例 如 ， 可 以 编写 | 

cout<<BEST_PAID_MESSAGE<<bestPaid; 

这 个 语句 的 第 一 一 部 分 一 一 cout<<BEST_ PAID „MESSAGE, 返回 对 一 个 ostream 对 象 的 引 用 ， 
然后 这 个 对 象 在 bestPaid 上 应 用 它 的 operator<<。 通常 ， 当 一 个 运算 符 返 回 与 调用 它 的 对 象 
”类 型 相同 的 引用 时 ， 就 可 以 把 几 个 这 种 运算 符 的 调用 连接 在 起 


实验 3 探讨 了 operator= 的 重 载 ， 它 和 operator> 的 重 载 很 相似 ; 还 讨论 了 operator>> 的 


重 载 ， 它 和 operator<< 的 重 载 很 相似 。 





实验 3; MENA "= 和 运算 待 “>>” RAAT RED 


1.1.3 节 介绍 了 数据 抽象 原理 ， 由 此 使 用 某 个 类 的 代码 不 应 当 访问 该 类 的 实现 细节 。 这 样 
会 不 会 给 用 户 造成 负担 ? protected 修 饰 符 适 合用 在 什么 地 方 ? friend 怎 么 样 呢 ? 1.1.12 节 描 
述 了 C++ 禁 止 用 户 民 码 访问 所 使 用 的 类 的 实现 细 的 限制 程度 问题 。 IM 


1.1.12 AM 
数据 抽象 原理 说 明了 用 户 的 代码 不 应 当 访问 所 使 用 类 的 实现 细节 。 根 据 这 个 原理 ， 可 以 


保护 用 户 代 码 不 受 那些 实现 细节 的 修改 的 干扰 ， 比 如 像 字 段 的 修改 。 如 里 用 户 代 码 不 能 访问 
所 使 用 类 的 实现 细节 ， 那么 保护 将 进一步 增强 。 在 下 面 的 原理 中 说 明了 这 一 限制 ; 


信息 隐藏 原理 





一 个 语言 应 SHAT AA RLM? RAURAOR NT. vc 





er 


Re NRA PHBE, 反之 ， 信息 隐 下 原理 为 类 开发 者 提供 了 一个 语言 
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性 的 支持 。 这 两 个 原理 的 目的 是 相同 的 : 保护 类 用 户 不 受 类 的 内 部 改动 的 影响 ; 内 部 改动 只 
影响 类 的 定义 ， 但 不 影响 类 的 公有 方法 接口 。 

前 面 已 经 看 到 C++ 通过 对 方法 和 字段 使 用 private 和 protected 修 饰 符 来 支持 信息 隐藏 ， 
private 修 饰 符 获得 完全 的 隐藏 : 只 有 类 的 方法 才 可 以 访问 Private 的 非 局 部 变量 和 方法 。 
protected 修 饰 符 对 一 般 用 户 提 供 了 完全 的 隐藏 ， 但 是 它 人 允许 类 的 任意 子 类 进行 访问 。 

有 可见 性 修饰 符 public 允 许 任何 类 进行 访问 。 最 后 ，C++ 提 供 一 个 “漏洞 ”来 避免 信息 隐 
藏 ， 即 friend 修 饰 符 。 正 如 在 1.1.11 节 所 见 ， 如 果 类 A 用 friend 修 饰 符 声 明 类 B (或 是 类 B 中 的 
一 个 方法 )， 那 么 所 有 类 A 的 成 员 ， 即 使 是 private 成 员 ， 都 可 以 被 类 B 中 的 成 员 (或 是 类 B 中 
声明 为 友 元 的 方法 ) 访问 。 

总 结 


=A 


在 这 一 章 以 及 实验 ! 到 实验 3 中 ,收集 了 C++ 的 一 些 主题 ， 这 有 助 于 读者 理解 和 使 用 标准 
模板 库 。 章 中 大 部 分 内 容 都 探索 了 C++ 的 面向 对 象 特性 。 例 如 ，C++ 支 持 面向 对 象 语言 的 这 些 
基本 特点 : 

封装 : 通过 类 、 头 文件 和 源 文件 以 及 作用 域 解 析 运 算 符 。 

继承 : 通过 子 类 和 protected 成 员 。 

面 问 对 象 语 言 的 第 三 个 基本 特点 一 -多 态 ， 在 附录 3 中 有 详细 的 解释 。 

同时 读者 也 看 到 了 面向 对 象 编程 的 三 个 相关 原理 : 

28 | 数据 抽象 原理 : 用 户 的 代码 不 应 当 访问 所 使 用 类 的 实现 细节 。 
开放 一 封闭 原理 : 每 个 类 都 应 当 被 打开 一 一 也 就 是 能 够 通过 继承 扩展 ， 并 封闭 一 一 也 就 是 


在 现 有 应 用 中 保持 稳定 性 。 
信息 隐藏 原理 :一 个 语言 应 当 允 许 类 的 开发 者 禁止 用 户 代码 访问 类 的 实现 细节 ， 
习题 


1.1 在 dateMain 项 H 中 重新 实现 Date 类 的 isValid 方 法 一 在 本 书 网 站 的 源 代 码 链 接 中 ， 假 
设 Date 类 只 有 一 个 字段 : 
long theDate; | | 
日 期 的 格式 是 (mjmddyyyy， 也 就 是 说 ， 月 使 用 一 位 或 两 位 ,每 月 中 的 日 使 用 两 位 ， 
年 使 用 4 位 。 例 如 ， 值 1042005 代 表 2005 年 1 月 4 日 ; 值 10042005 代 表 2005 年 10 月 4 日 
1.2 a. 在 Date 类 中 ， 为 daysLeftIaMonth 方 法 开发 一 个 方法 接口 。 例 如 ， 如 果 myDate 是 
一 个 Date 对 象 ， 它 的 日 期 是 2003 年 2 月 13 H ; HAmyDate.daysLeftInMonth() 43k 
B. UT | | 
b. 根据 习题 “2a 开发 的 方法 接口 定义 daysLeftInMonth0) 方 法 。 假设 Date 类 使 用 int 型 字 
7 段 day、month 和 year。 
提示 使 用 daysInMonth 方 法 。 


1.3 在 Employee 类 中 ， 有 一 个 equalTo 方 法 ， 它 的 方法 接口 是 : 


// 后 置 条 件 : 如 Riz TEmployes FotherEmployee k Hi zk 总 额 相等 就 返回 真 ， 
VEU, EMR, 





bool equalTo (const Employee& otherEmployee) const; 
a. 定义 这 个 方法 。 
b. 将 equalTo 方 法 替换 成 运算 符 = = 的 重 载 版 本 。 


提示 所 有 需要 修改 的 就 是 头 。 


1.4 下 面 是 一 个 简单 类 的 头 文件 : 
#ifndef AGE 
#define AGE 
class Age 
{ 
public: 


// 后 置 条 件 : 这 个 Age 被 初始 化 为 0。 
Age(); 


// 后 置 条 件 : 这 个 Age 被 初始 化 为 newAge, 
Age ( int newAge); 


// 后 置 条 件 : 返回 这 个 Age。 
int getAge(); 


/后 置 条 件 : 将 这 个 Age 设 置 成 newAge: 
void setAge (int newAge); 
protected: 
| int age; 
);//3€ Age 
ffendif 
a. 为 Age 类 创建 源 文 件 (Age.cpp). 


b. 创建 一 个 文件 以 及 main 函 数 ， 在 这 个 函数 中 定义 Age 对 象 并 且 调用 每 个 方法 至 少 
两 次 。 
L5 根据 习题 1.4a 中 的 Age 类 ， 开 发 一 个 Salary 类 读 输入 的 薪水 ， 直 到 到 达 结 束 标记 
(-1.00; 并 输出 超过 平均 值 的 薪水 数量 ， 闭 水 平均 值 是 妆 水 的 总 和 除 以 新 水 的 份 数 
除了 一 个 缺 省 构造 器 ， 还 有 两 个 方法 ， 它 们 的 接口 如 下 : 


/后 是 条件: RERA (结束 标记 = 一 1.0) 的 所 有 薪水 的 平均 值 
void findAverageSalary(); 


WM BRE: 至 少 输入 一 个 薪水 值 (在 结束 标记 之 前 ] 
(BREE: 输出 在 输入 中 超过 平均 值 的 薪水 值 。 


void printAboveAverageSalaries(): 
假设 除了 最 后 一 行 之 外 ， RAET ui A Aio, 并 且 输入 中 有 
至 少 1 个 至 多 100 个 这 样 的 薪水 。 A Amaina ANR Salary,” uu 


1.6 下 面 是 一 个 简单 类 的 头 文件 SimpleClass.h: 
. #ifdef SIMPLE CLASS . 
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#define SIMPLE_CLASS 
class SimpleClass 


{ 
public: 


// 后 置 条 件 : 这 个 SimpleClass 对 象 被 初始 化 成 最 小 的 GPA 并 输出 ， 
SimpleClass(); 


I S (RS 这 个 SimpleClass 的 最 小 GPA 被 初始 化 成 gpa_in 并 输出 。 
SimpleClass (float gpa_in); 


protected: 
const static float MIN_GPA; 
float gpa; 
y/SimpleClass 
#endif 
开发 相应 的 源 文件 SimpleClass.cpp。 下 面 给 出 T— Amain Z3 Jl iA SimpleClass2: 


#include <iostream> 
#include <string> 
#include "SimpleClass.h" 


using namespace std; 


int main( ) 
{ 
const string CLOSE_WINDOW_PROMPT = 
"Please press the Enter key to close this output window."; 


SimpleClass sc1; 
SimpleClass sc2 (3.2); 


cout << endl << endl << CLOSE. WINDOW. PROMPT; 
cin.get(); ` | | | 


return 0; 
) // main | 


输出 将 是 
2 
3.2 
请 按 下 “ 回 车 ” 键 关闭 这 个 输出 窗口 。 
1.7 在 习题 1.6 的 SimpleClass.h 中 ， 将 行 7 
float gpa; | 
. 替换 成 行 。 
float gpa = MIN_GPA; | 
当 重 新 生成 并 返回 项 目 时 会 出 现 什么 情况 ? 
1.8 在 习题 1.6 的 SimpleClass.cpp 中 ， 注 释 掉 头 文件 中 的 缺 省 构造 器 ， 但 不 注释 掉 源 文 件 
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中 的 。 重 新 生成 并 返回 项 目 时 会 出 现 什么 情况 ? 如 采 注 释 掉 源 文件 中 的 但 不 注释 掉 
KCPE He B fik S A is AE ar EPE? 如 果 将 源 文 件 和 头 文件 中 的 缺 省 构造 器 都 和 注释 掉 又 
会 怎样 ? 

1.9 在 习题 1.6 的 SimpleClass.cpp 中 , 使 用 下 面 的 定义 作为 缺 省 构造 器 : 
SimpleClass :: SimpleClass() { ) 


当 重 新 生成 并 返回 项 目 时 会 出 现 什么 情况 ? 
1.10 将 方法 定义 加 入 到 头 文件 是 合法 的 。 那 么 将 方法 定义 放 在 源 文 件 ， 和 头 文件 分 离开 ， 
这 样 会 获得 什么 样 的 功效 ? 


编程 项 目 1.1: 一 个 Sequence 类 


在 这 个 项 目 里 ， 读 者 首先 是 一 个 类 的 开发 者 ， 然 后 又 成 为 这 个 类 的 用 户 。 开始 时 ， 给 出 
Sequence 类 的 一 些 方法 接 日 ， 它 们 当中 保持 了 一 系列 string 类 型 的 项 。 


// 后 置 条 件 : 这 是 一 个 空 Sequence 。 
Sequence(); 


/后 置 条 件 : 如 果 这 个 Sequence 不 能 再 储存 任何 项 就 返回 真 。 否 则 ， 返 回 假 。 


bool full() const; 


/后 置 条 件 : 返回 这 个 Sequence 中 项 的 当前 数量 . 
int size() const; 


// 前 置 条 件 : 这 个 Sequence 中 至 少 保有 一 个 项 。 
NAER: 在 这 个 Sequence 里 添加 s (插入 到 最 后 )。 
void push_back (const string& s); 


// 前 置 条 件 : 这 个 Sequence 里 至 少 有 k 个 项 。 

/后 置 条 件 : 返回 对 这 个 Sequence 里 位 置 k 上 的 项 的 引用 . 
string& operator[ ] (int k ); 

第 一 部 分 : 定义 Sequence 类 的 方法 。 

提示 使 用 下 面 的 字段 : 


String data [ MAX SIZE] // 保 存 项 的 数组 
int Count; /Sequence 中 项 的 当前 数量 
和 | 


const static int MAX SIZE = 10; // 整 型 常量 是 合法 的 


第 二 部 分 : 创建 一 个 main 函 数 来 测试 Sequence 类 。 每 行 读 和 人 一 个 单词 ， 当 到 达 结 束 标记 
(开发 者 自己 选取 的 结束 标记 ) 时 ， 求 出 Sequence 中 按 字母 顺序 最 小 的 和 最 大 的 单词 ， 并 将 每 
个 包含 “no” 的 单词 中 的 这 部 分 换 成 “yes”， 然后 求 出 Sequence 中 介 于 “aardvark” 和 — 
“panda” 之 间 的 单词 数量 。 





第 2 章 ”容器 类 的 存储 结构 


这 一 章 仍 然 是 为 通用 的 数据 结构 和 具体 的 标准 模板 库 的 学 习 做 准备 。 从 大 多 数 人 公认 的 
最 难 而 且 最 容易 出 错 的 C++ 的 特点 一 一 即 指针 的 概念 一 一 开始 ， 但 是 指针 同时 也 是 功能 非常 强 
大 而 且 应 用 非常 广泛 的 ， 因 此 迟早 都 必须 掌握 它 。 本 章 中 还 介绍 了 容器 类 : 数据 结构 的 面 
对 象 版 本 。 容 器 类 是 指 它 的 每 个 实例 都 收集 了 很 多 项 的 类 。 这 里 特别 有 意思 的 是 容 如 类 的 存 
储 结构 ， 主 要 是 数组 和 链 式 结构 。 本 章 的 最 后 讨论 了 标准 模板 库 的 一 个 重要 的 组 件 一 一 通用 
型 算法 ， 它 是 预定 义 的 、 模 板 国 数 ， 它 增 大 了 容器 类 中 方法 的 收集 。 


目标 


1) 理解 指针 和 动态 变量 。 

2) 探索 顺序 结构 和 链 式 结构 的 优 缺 点 。 
3) 学 习 Linked 类 中 的 字段 和 方法 。 

4) 能 够 创建 并 使 用 模板 类 。 

5) 定义 和 使 用 迭代 器 。 | 

6) 学 习 如 何 找到 和 使 用 通用 型 算法 。 


2.1 指针 


现代 编程 语言 允许 编程 者 在 程序 运行 过 程 中 显 式 地 创建 和 撤消 变量 。 这 些 变量 称 作 动态 
变量 ， 它 的 存储 区 域 在 需要 时 进行 分 配 ， 而 当 不 握 使 用 时 释放 。 堆 就 是 为 动态 变量 保留 的 一 
大 块 内 存 区 域 。 

指针 变量 包含 了 另 一 个 变量 的 地 址 。 | 

与 普通 变量 不 同 ， 动 态 变量 是 决 不 能 直接 访问 的 。 实 际 上 ， 一 个 动态 变量 根本 就 没有 一 
个 标识 符 。 相 反 ， 动 态 变量 总 是 通过 一 个 指针 变量 来 间接 访问 。 指 针 变 量 是 一 个 变量 ， 它 包 
含 了 另 一 个 变量 ， 通 常 是 动态 变量 的 地 址 。 指针 类 型 由 一 个 类 型 和 随后 的 一 个 星 号 组 成 。 举 
一 个 简单 的 例子 ， 可 以 声明 : 


int* scorePtr; 


这 将 变量 scorePtr 声 明 为 一 个 指针 变量 。 最 终 ， scorePtr 将 包含 一 个 nt 型 变量 的 地 址 ， 要 
创建 一 个 动态 变量 ， 并 令 scorePtr 指 向 它 ， 可 以 使 用 new 运 算 符 : 


scorePtr = new int; 

new 运 算 符 为 一 个 动态 变量 分 配 了 存储 空 间 。 | 

在 这 个 例子 中 ，new 运 算 符 的 操作 数 是 类 型 nt， 将 为 这 个 类 型 分 配 存储 空间 ， 并 返回 一 
个 指针 指向 这 个 空间 。 换 名 话说 ， 当 执行 ij 赋值 语句 scorePtr=new int; 时 ， 将 创建 一 个 int 类 型 


的 动态 变量 ， 并 将 这 个 动态 变量 的 地 址 存放 在 scorePtr 里 。 用 图 示 方 法 ， 可 以 从 指针 变量 到 动 
态 变量 之 间 画 一 个 箭头 : 


[35 | 
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scorePtr 


问号 表示 这 个 动态 变量 尚未 赋值 。 如 果 想 访问 或 修改 动态 变量 必须 通过 指针 变量 ， 在 这 
个 例子 中 ， 就 是 scorePtr。 这 可 以 通过 在 scorePtr 的 前 面 放 上 一 个 星 号 来 实现 ， 例 如 ， 

*scorePtrz7; // 在 动态 变量 中 存储 了 7 

cin»»*scorePtr; // 从 输入 中 读 入 数据 ， 放 进 动态 变量 

if(*scorePtr==0) // 测试 动态 变量 中 是 否 包含 0 

上 面 的 例子 里 ， 动 态 变量 是 int 类 型 的 。 在 很 多 应 用 中 ， 动 态 变量 的 类 型 是 类 。 下 面 的 例 
子 中 将 创建 一 个 动态 对 象 ， 即 一 个 动态 变量 , 它 的 类 型 是 一 个 类 。 回 忆 第 1 章 中 的 Employee 类 。 


首先 声明 一 个 指针 变量 : 


Employee* employeePtr; 


就 像 对 scorePtr 所 做 的 工作 一 样 ， 现 在 通过 调用 new 运 算 符 创建 动态 Employee 变 量 : 

employeePtr = new Employee; 

为 了 访问 Employee 类 型 的 动态 对 象 的 一 个 成 员 (也 就 是 一 个 字段 或 者 方法 )， 可 以 应 用 脱 
引用 ( 即 解除 引用 ) 运算 符 一 一 星 号 : 

(*employeePtr).readinto(); - 

外 面 的 圆 括号 是 必须 的 ， 因 为 成 员 选 择 运 算 符 一 一 点 一 一 比 脱 引用 运算 符 的 优先 级 高 。 
但 是 对 一 个 指向 动态 对 象 的 指针 脱 引 用 ， 然 后 选择 这 个 对 象 的 成 员 是 一 个 非常 常见 的 操作 ， 
C++ 中 有 一 个 关于 这 个 应 用 的 特殊 符号 ， 即 脱 引用 和 选择 运算 符 一 一 -> ， 它 可 以 按 如 下 方式 
使 用 : 


employee Ptr->readInto(); 


在 定义 指针 变量 时 必须 小 心 ， 因为 Ct+ 编 译 器 隐 式 地 将 "和 变量 而 不 是 类 型 联系 在 一 起 。 
例如 ， 下 面 的 语句 

Employee* empiPtr; 

emp2Ptr; 

声明 了 一 个 指针 变量 emp1Ptr。 变 量 emp2Ptr 一 一 尽管 它 的 名 字 昕 起 来 像 指 针 一 一 只 是 一 个 
普通 的 Employee 对 象 。 如 果 想 声明 同一 类 型 的 多 个 指针 变量 ， 中 以 在 再 明 前 面 加 上 一 个 
typedef， 为 指针 类 型 给 出 一 个 名 字 。 例 如 ， 

typedef Employee* EmployeePtr; 


这 条 语句 使 得 EmployeePtr 成 为 类 型 Employee* 的 另 一 个 名 字 。 在 typedef 里 声明 的 名 字 可 
以 用 来 声明 一 个 变量 。 例 如 ， 

EmployeePtr emp1Ptr, 

emp2Ptr; 

BLD T PAT tele Employee xt S f tpe i. 注意 这 里 没有 使 用 *，typedef 只 不 过 为 一 
个 类 型 声明 了 另 一 个 名 字 。 

另 一 种 声明 同一 类 型 的 两 个 指针 变量 的 方式 是 使 用 两 个 声明 语句 : 

Employee* emp1Ptr: | 

Employee* emp2Ptr; 
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2.1.1 堆 和 堆栈 的 对 比 


读者 可 能 感到 奇怪 ， 为 什么 声明 指 同 历 员 的 变量 ， 而 不 直接 声明 雇员 。 一 个 原因 是 为 了 
节约 堆栈 一 一 存储 局 部 变量 的 部 分 内 存 空间 。 假 设 在 Company 类 的 findBestPaid() 方 法 中 声明 
emp1Ptr 和 和 emp2Ptr。 因 为 emp1Ptr 和 emp2Ptr 都 是 局 部 的 ， 所 以 只 需要 分 配 指针 自身 的 堆栈 空 
间 肥 可 ， 而 保存 两 个 雇员 需要 的 堆栈 空间 要 多 很 多 。 当 然 ， 使 用 动态 变量 ， 那 么 两 个 雇员 将 
存放 在 堆 中 ， 而 堆 比 堆栈 要 大 多 了 。 如 果 一 个 类 的 每 个 对 象 都 由 很 多 项 组 成 ， 那 么 使 用 堆 比 
使 用 堆栈 ， 其 优势 是 不 言 而 喻 的 。 


2.1.2 引用 参数 


引用 参数 代表 对 指针 的 一 个 灵活 运用 。 引 用 参数 是 一 个 不 可 修改 的 指针 ， 它 是 自动 脱 引 
用 的 。 当 调用 函数 时 ， 指 针 获取 相应 变 元 的 地 址 ， 在 函数 的 整个 执行 中 ， 指 针 保 持 了 相同 的 
地 址 。 苑 数 执行 过 程 中 ， 指 针 自动 脱 引 用 ; 也 就 是 说 ， 如 果 x 是 一 个 引用 参数 ， 那 么 函数 里 每 
次 出 现 的 x 都 被 解释 为 

例如 ， 假 设 有 下 面 的 程序 段 


vold sample (int& i) 


{ | 
1 = 3; 
y/ sample - 


int main( ) 


{ 
int j = 5; 


sample (j); 
cout << j; 
return 0; 

) // main 


正如 定义 所 指出 的 ，j 是 一 个 Int 类 型 的 变量 ， 它 的 初始 什 是 5。 参 数 的 类 型 不 是 jnt， 而 是 
指向 int 的 指针 。 当 从 main 函 数 中 调用 sample 函 数 时 ， 变 量 j 的 地 址 被 拷贝 到 i 中 。 下 面 的 图 显 
示 了 调用 时 内 存 相关 部 分 的 内 容 : 


i j 
| — 
因为 引用 参数 是 自动 及 引 用 的 TL 

i-3; | 

被 解释 成 

*jz3; | | 四 

当 执行 这 个 语句 时 ，“i， 也 就 是 的 值 将 发 生 改 变 : 
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因此 程序 的 输出 将 是 3， 而 不 是 5。 
2.1.3 指针 字段 
类 可 以 包含 指针 类 型 的 字段 ， 包 括 指 向 它 自 身 类 型 的 指针 ， 例 如 ， 


class Student 


{ 
public: 
ss /方法 声明 


protected: 
string name; 
float gpa; 
Student* next: 
y; // Student 


那么 一 个 Student 对 象 中 的 一 个 字段 是 指向 另 一 个 Student 对 象 的 指针 ， 然 后 这 个 对 象 的 一 
个 字段 又 是 一 个 指向 另 一 个 Student 对 象 的 指针 ， 等 等 。 这 样 的 类 可 以 用 来 将 任意 数量 的 学 生 
记录 “链接 ”在 一 起 。 指 针 的 这 个 非常 重要 的 应 用 将 在 2.3.2 节 叙述 ， 它 是 标准 模板 库 中 的 几 
个 类 的 最 通用 实现 的 基础 : 它们 是 list、map 和 set。 

指针 的 另 一 个 应 用 是 对 多 态 性 (这 是 附录 3 的 主题 ) 的 支持 。 


2.1.4 数组 和 指针 


指向 数组 的 指针 是 很 特别 的 。 指 向 数组 元 素 的 指针 是 元 素 指 针 类 型 的 。 例 如 ， 指 向 一 个 
int 类 型 的 数组 的 指针 可 以 声明 成 : 

int* scores; 

注意 这 里 没有 说 明 数 组 的 大 小 ， 而 实际 上 ，scores 既 可 以 指向 单个 int 类 型 变量 ， 也 可 以 
指向 一 个 int 类 型 的 数组 。 

为 了 在 堆 中 分 配 一 个 数组 ， 需 要 将 元 素数 量 填 入 一 对 方 括号 中 。 例 如 ， 

cin>>n; 

scores = new int[n]; 

为 包含 n 个 整数 的 数组 分 配 了 空间 ， 并 在 scores 里 存储 了 数组 第 一 个 元 素 的 地 址 。 注 意 数 
组 的 大 小 是 n 中 存储 的 值 ， 并 且 这 个 值 直到 运行 时 才 知 道 。 通 常情 况 下 ， 从 堆 中 为 数组 分 配 空 
间 时 ， 必 须 在 编译 时 就 清楚 数组 的 大 小 ; 而 它 可 以 在 运行 时 再 确定 |! | 

如 何 访问 数组 元 素 呢 ? 下 标 运算 符 operator[] ， 自 动 脱 引用 一 个 指向 数组 的 指针 ， 并 访 
问 对 应 的 内 存 位 置 。 在 前 面 关 于 C++ 的 学 习 中 ， 读 者 必定 已 经 注意 到 数组 第 一 个 元 素 的 下 标 
是 0。 例 如 ，scores[0] 将 访问 数组 的 第 一 个 元 素 ， 而 scores[2] 将 访问 数组 的 第 三 个 元 素 。 注音 
在 这 个 表达 式 中 没有 星 号 。 这 是 因为 数组 变量 被 看 作 是 一 个 自动 脱 引 用 的 指针 ， 它 指向 指定 
数组 的 第 一 个 元 素 。 
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通用 数组 指针 定理 
通常 ， 对 任意 数组 a 和 非 负 整数 :，a[i] 和 "(ati) 是 等 价 的 。 


例如 ， 使 用 前 面 定义 的 scores ，scores[3] 访 问 的 元 素 与 (scores+3) 访 回 的 元 素 是 相同 的 。 
如 果 在 一 个 函数 中 简单 地 声明 了 : 
float a[100]; 


那么 不 是 从 堆 ， 而 是 从 堆栈 中 为 数组 分 配 空间 。 任 何 存储 在 堆栈 中 的 数组 的 大 小 必须 给 
定 为 一 个 常数 。 即 便 这样 ， 数 组 指针 定理 仍然 成 立 。 
实验 4 增强 了 指针 变量 赋值 和 动态 变量 赋值 之 间 的 区 别 。 
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实验 4: 指针 变量 赋值 与 动态 变量 赋值 的 对 比 (所 有 实验 都 是 可 选 的 ) 


2.1.5 动态 变量 的 存储 空间 释放 


动态 变量 的 内 存 空 间 是 在 调用 new 运 算 符 时 分 配 的 ， 但 是 怎样 释放 呢 ? 不 再 访问 的 动态 
变量 称 作 是 无 用 单元 或 是 一 个 内 存 泄漏 。 如 果 程 序 中 产生 了 过 多 的 无 用 单元 ， 那 将 造成 内 存 
溢出 ， 这 是 一 种 错误 的 情况 。 那 么 开发 者 有 没有 责任 进行 无 用 单元 收集 ， 即 释放 不 再 访问 的 
动态 变量 的 空间 呢 ? 

dejete 运 算 符 释放 一 个 动态 变量 占据 的 存储 空间 。 

不 笠 的 是 ， 开 发 者 必须 处 理 自己 的 无 用 单元 。C++ 提 供 了 一 个 delete 运 算 符 用 来 释放 一 个 
动态 变量 占据 的 存储 空间 。 这 个 运算 符 只 有 一 个 操作 数 一 一 即 指向 即将 被 释放 的 动态 变量 的 
指针 。 因 此 可 以 编写 下 面 的 程序 : 

Node* nodePtr; 

nodePtr=new Node; 

4% FA*nodePtr 


直面 昌 曲面 二 


delete nodePtr; 


最 后 一 条 语句 释放 了 nodePtr 指 向 的 动态 变量 占据 的 存储 空间 ; 现在 脱 引用 nodePtr 是 非法 
的 。 FH. 不论 是 否 调 用 delete 运 算 符 ， SEAM RRR OUS NULL, 来 表 
示 这 个 指针 变量 不 再 指向 任何 SRI: 

nodePtrzNULL; 


sac STE RE delete RR FHR, 例如 ， 
string* nanies; | 

names-new string[500]; 

《使 用 数组 names 


delete[] names; 


2.3. 5 将 到 使 有 delete 运算 特 和 放大 量 动态 变 和 的 存储 各 
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2.2 数组 


回忆 一 下 ，2.1.4 节 提 到 ， 一 个 数组 变量 实际 上 是 一 个 指针 变量 ， 它 包含 了 数组 第 一 个 条 
目的 地 址 。 例 如 ， 运 行 下 面 的 程序 : 


string* names; // 将 names 声 明 为 字符 串 指针 类 型 
names=new string[5]; // 将 names 定 义 成 (一 个 指针 ， 指 和 癌 ) 包含 5 个 
// 字 符 串 的 数组 
names{0]= "Cromer"; // 在 names 数 组 的 第 一 个 条 目 里 存储 "Cromer" 


names[3]= "Panchenko"; // 在 names 数 组 的 第 四 个 条 目 里 存储 "Panchenko" 
根据 数组 指针 定理 ， 前 一 条 将 "Cromer 赋 给 names[0] 的 赋值 语句 等 价 于 


*names="Cromer": 


X" Panchenko" mM names[3 | HRMS DEF 


*(names+3)="Panchenko"; 


一 旦 创建 了 数组 ， 那 么 它 的 大 小 就 是 固定 的 ， 而 新 的 数组 (由 同一 个 指针 变量 指向 的 ) 
可 以 迟 些 创 建 。 例 如 ， 可 以 编写 

string* names; 

int n; 


cin>>n; 

names=new string[n]; 

delete[] names;//38& 4A Gs 
names=new string[2*n]; 


数组 中 相 邻 的 元 素 是 连续 存储 的 ， 也 就 是 存储 在 相 邻 的 位 置 上 。 这 种 邻接 性 的 一 个 重要 
结果 就 是 在 访问 数组 中 一 个 单独 的 元 素 时 ， 不 需要 先 访问 任何 其 他 的 元 素 。 例 如 ， 可 以 直接 
访问 names[2] ， 而 不 需要 先 访 问 names[0] 和 names[1] 再 到 达 names[2]。 数 组 的 这 种 随机 访问 属 
性 在 第 5、11、13 章 中 很 容易 看 到 。 在 任何 情况 下 都 需要 一 个 存储 结构 ， 在 这 个 结构 中 给 定 相 
对 位 置 就 能 快速 地 访问 到 元 素 ， 因 此 数组 在 任何 情况 下 都 是 适用 的 。 

数组 也 有 几 个 缺点 。 首 先是 因为 元 素 是 连续 的 ， 数 组 的 大 小 是 固定 的 ; 所 以 整个 数组 的 
空间 必须 在 元 素 存 人 数组 之 前 分 配 。 如 果 太 大 ， 就 会 有 很 多 空间 不 能 使 用 ; 如 果 太 小 ， 就 必 
须 再 分 配 一 个 大 的 数组 ， 然 后 将 小 数组 的 内 容 转 移 到 大 数组 里 。 

数组 的 另 一 个 缺点 是 它 的 插入 和 删除 需要 移动 太 多 元 素 。 例 如 ， 假 设 一 个 数组 的 下 标 从 0 
到 999， 并 且 现 在 从 0 到 755 的 下 标 上 都 存储 了 元 素 。 如 果 一 个 新 的 元 素 要 放 到 下 标 300 上 ， 那 
么 在 这 个 元 素 被 插入 之 前 ， 必 须 先 将 下 标 在 300 至 755 之 间 的 元 素 依次 移动 到 301 至 756 之 间 的 
下 标 处 。 图 2-1 显 示 了 这 样 插入 的 效率 。 

到 目前 为 止 的 编程 工作 中 ， 读 者 可 能 还 没有 正确 的 评价 数组 的 随机 访问 特性 。 那 是 因为 
现在 仍 没 有 看 到 除了 数组 之 外 ， 内 存 中 还 有 存储 元 素 集 的 其 他 方式 。2.3 节 里 介绍 了 这 种 方式 ， 
它 在 动态 对 象 上 也 是 非常 通用 的 。 





图 2-1 在 数组 中 进行 插入 : 将 "Kaleria" 插 入 到 左边 数组 的 下 标 300 处 ， 必 须 
到 下 标 301，302，…，756 的 位 置 上 


2.3 ares 


容器 类 是 一 个 类 它 的 年 个 实例 都 也 含 了 很 多 项 
容器 是 一 个 变量 ， 它 由 很 多 项 的 集合 组 成 。 迄 今 为 止 接触 到 的 惟一 的 容器 就 是 数组 ， 但 
是 以 后 几乎 全 部 的 工作 都 专注 于 其 他 的 容器 。 即 容器 类 的 实例 。 容 器 类 是 一 个 类 ， 它 的 对 象 
都 是 容器 。 第 5~14 章 将 学 习 到 许多 应 用 广泛 的 容器 类 。 通 常 ， 这 些 容器 类 都 由 相似 的 方法 接 [42] 
口 。 例 如 ， 每 个 容器 类 都 有 一 个 empty 方 法 ， 它 的 接口 是 :， 
/后 置 条 件 : ROLL All, BER. 
bool empty() const; P 
限 设 myList 是 容器 交 ist 的 一 个 对 象 并 且 有 四 个 项 。 执行 
cout««myList. empti; cs oh 
“将 输出 HÀ TES ERE - 
0 EX xen O41 sg nna c C198 CBP 
因为 在 C++ 中 ， 常 数 0 和 false 是 同 义 的 (并 且 它 们 和 NULL 也 都 是 同 久 的) 00 
当然 ， 方 法 接口 无 法 说 明 方法 的 任务 是 如 何 实现 的 。 在 第 5~14 章 中 ， 将 探讨 学 到 的 每 个 
容器 类 的 细节 。 但 是 现在 根据 项 的 存储 方式 ， 可 以 将 容器 类 简单 的 分 类 。 43 | 


2.3.1 容器 类 的 存储 结构 
容器 对 象 ， 也 就 是 容器 类 的 实例 对 象 ， 通 常 占据 与 容器 中 项 的 数量 成 比例 的 内 存 空间 。 
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因此 容器 在 内 存 中 的 存储 方式 对 程序 的 效率 有 巨大 的 影响 。 一 种 直截了当 的 存放 容器 对 象 的 
方法 是 连续 存储 单独 的 项 : 存储 在 数组 里 。 容 器 类 将 提供 方法 和 重 载运 算 符 来 创建 并 维护 数 
组 。 从 用 户 的 角度 来 看 ， 这 样 的 类 拥有 数组 的 优点 〈 像 熟悉 的 下 标 运算 符 一 operator[] fü 
随机 访问 性 质 )， 而 没有 它 的 缺点 〈 维 护 数组 的 大 小 ， 在 插入 和 删除 项 时 编写 代码 的 缺陷 )。 
这 种 方法 在 第 5$ 章 学 习 标准 模板 库 的 vector 类 时 进行 了 介绍 。 

在 内 存 中 存储 容器 对 象 的 另 一 种 方式 是 采用 一 种 基于 指针 的 链 式 结构 (这 是 2.32 节 的 主 
题 )。 正 如 读者 将 在 以 后 章节 、 项 目 和 实验 中 所 看 到 的 ， 这 两 种 方式 都 有 很 广泛 的 应 用 。 


2.3.2 链 式 结构 


现在 不 使 用 数组 也 可 以 在 内 存 中 存储 一 个 容器 。 基 本 思想 是 为 每 个 项 关联 一 个 链接 (也 
就 是 一 个 指针 )， 指 向 容器 的 下 一 项 。 因 此 容器 中 全 部 的 项 像 项 链 一 样 都 链接 在 一 起 。 现 在 创 
建 一 个 简单 的 容器 类 示例 一 一 Linked。Linked 类 不 是 标准 模板 库 中 的 内 容 。 实 际 上 ， 它 只 有 三 
个 方法 (初始 时 )， 是 一 个 “玩具 ”类 ， 它 的 实践 价值 在 于 给 出 了 关于 容器 类 实现 的 一 些 观点 。 
实验 5、6 和 7 是 使 用 这 个 类 的 试验 。 

照常 从 用 户 的 角度 开始 。 什 么 是 这 个 类 必须 提供 给 用 户 的 ?第 一 个 要 点 是 需要 指明 项 的 
类 型 是 什么 。 是 需要 int 型 ， Employee 对 象 或 其 他 类 型 的 对 象 的 Linked 容 器 吗 ” 无 论 选 择 哪 一 
个 都 将 彻底 限制 容器 类 的 实用 性 。 最 好 的 选择 是 让 用 户 自己 选择 ! 也 就 是 说 ， 让 Linked 类 的 
用 户 在 定义 Linked 容 器 对 象 时 决定 项 的 类 型 。 创 建 这 个 灵活 的 Linked 类 依 环 于 C++ 的 一 个 强大 
功能 一 一 模板 。 

当 一 个 容器 类 被 模板 化 时 ， 类 的 每 个 实例 部 包含 一 个 模板 变 元 : 单独 项 的 类 型 。 

不 用 定义 单个 容器 类 ， 而 是 定义 一 个 模板 (或 者 说 模子 )， 它 允许 在 编译 时 创建 菜 些 固定 
类 型 的 容器 类 。 这 个 固定 类 型 好 像 是 容器 类 的 一 个 “ 变 元 类 型 >。 这 里 模板 类 的 名 字 是 Linked 
用 户 跟 在 带 模板 变 元 ”的 类 标识 符 后 ， 模 板 变 元 在 类 名 的 后 面 以 角 括 号 括 起 。 例 如 ， 这 里 给 
出 了 一 个 int 类 型 和 一 个 Employee 对 象 类 型 的 Linked 容 器 的 定义 : 

Linked<int> intList; 

Linked<Employee> employeeList; 


从 这 个 观点 来 说 ， 除 了 int 型 项 ， 向 intList 中 插入 任何 项 都 是 非法 的 ， 除 了 Employee 对 
象 ， 门 employeeList 中 播 人 任何 项 也 都 是 非法 的 。 在 补充 Linked 类 的 方法 接口 之 后 将 给 出 一 
些 示例 。 

现在 看 一 下 在 Linked 类 的 定义 中 是 如 何 处 理 模板 的 。 开 始 是 关键 字 template， 后 面 跟着 
角 括 号 ， 及 其 里 面 的 关键 字 class 和 一 个 标识 符 : MARSH. 这 个 标识 符 将 在 编译 时 当 类 被 实 
例 化 时 ， 由 用 户 提供 的 类 型 替代 一 一 像 int 或 是 Employee。 下 面 是 定义 的 开头 : 

template<ciass T> 

class Linked 


{ 


当 模 板 类 被 实例 化 时 ， 模 板 变 元 蔡 换 类 的 定义 中 出 现 的 每 个 模板 参数 。 
在 下 一 段 中 将 会 看 到 ， 无 论 何 时 需要 在 Linked 类 的 定义 中 提供 一 个 项 的 类 型 ， 都 简单 地 





O 为 了 简单 起 见 ， 假 设 这 里 是 单个 的 模板 变 元 。 后 面 还 将 遇 到 有 多 个 模板 变 元 的 类 。 
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使 用 T。 读 者 可 能 会 感到 奇怪 ， 这 样 一 个 强大 的 特性 只 需要 做 这 么 少 的 工作 。 最 难 的 部 分 ， 也 
是 完全 可 以 忽略 的 ， 就 是 编译 器 正确 高 效 地 实现 模板 。 

现在 ，Linked 类 将 只 有 三 个 职责 : 创建 空 的 Linked 对 象 ， 返 回 Linked 对 象 中 项 的 数量 ， 在 
Linked 对 象 的 前 面 播 人 一 个 新 的 项 。 下 面 是 方法 接口 : 


// 后 置 条 件 : 这 个 Linked 对 象 是 空 的 ， 也 就 是 ， 没 有 任何 元 素 。 
Linked(); 


// 后 置 条 件 : 返回 Linked 对 象 中 项 的 数量 ， 


long size() const; 


// 后 起 条 件 : 在 这 个 Linked 对 象 的 前 面 插入 newltem 

void push_front(constT& newltem); 

注意 push_front 的 参数 是 类 型 T， 是 模板 参数 。 

现在 可 以 修改 那 两 个 Linked 对 象 ，intList 和 employeeList: 
intList.push front (27): 

intList.push, front (51); 

intList.push, front (12); 

Employee employee; 


employee.readinto( ); 
while (!employee.isSentinel( )) 
{ . 
employeeList.push. front (employee); 
employee.readinto( ); 


) // while 
每 个 项 都 被 插入 在 它 的 容器 的 前 面 ， 例如 ，intList 现 在 包含 下 列 顺 库 的 项 
12, 51, 27 


从 用 户 的 角度 来 看 ， 对 Linked 类 没什么 可 说 的 ， 所 以 将 注意 力 转移 到 这 个 类 的 字段 和 实 
3E. 一 种 可 能 性 是 使 用 一 个 数组 字段 并 将 项 存储 在 数组 里 。 习 题 2. 3 探讨 了 这 种 选择 。 

另 一 一 个 策略 是 将 容器 的 每 一 项 存储 在 一 个 名 为 Node 的 结构 (struct) 里 。Node 将 包含 
两 个 字段 : 一 个 item 的 字段 是 类 型 T， next 字 段 的 类 型 是 Node* , 也 就 是 指向 Node 的 指针 

struct Node 

{ 


T item; 
Node* next; 
y; /结构 Node 


Node 将 是 Linked 中 的 一 protected. 因为 Node 的 所 有 成 员 都 是 public 的 ， 所 以 
Linked 中 的 任何 方法 都 能 访问 到 Node 的 item 和 next 字 段 。 Linked 中 仅 有 的 字段 是 : 
Node* head MB 8 — 35 AR | 


o 结构 是 一 个 类 ， 它 的 每 个 成 员 都 是 public 的 。 在 一 个 结构 中 定义 方法 是 合法 的 ， TUER. P. 
构 对 象 只 包含 字段 。 
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long length;// 容 器 中 项 的 数量 
缺 省 构造 器 的 定义 非常 直接 : 
Linked() 
{ 
head=NULL; 
length=0; 
VRB 
"[ EAE SU EF a Sr es RETE CH BLE EB BLA X EE SK ICE 
linked.h 里 的 。 到 目前 为 止 ， 每 个 类 都 有 一 个 包括 声明 的 头 文件 以 及 包含 方法 定义 的 源 文件 。 
一 般 次 来 ， 分 配 存储 空间 的 代码 都 不 应 该 出 现在 头 文件 里 ; 那么 可 以 预 编译 头 文件 ， 而 不 用 
在 每 个 项 目 中 重新 编译 。 但 是 使 用 模板 时 ， 在 定义 类 中 的 对 象 前 不 会 进行 存储 空间 的 分 配 。 
因此 ， 为 了 简化 起 见 ， 就 把 声明 和 方法 定义 都 放 在 头 文件 linked.h 中 。 
size() 方 法 的 定义 甚至 比 缺 省 构造 器 的 定义 还 要 简单 : 
long size() const 
{ 


return length; 


WIA $size 


在 讨论 push_front 方 法 的 定义 之 前 ， 先 看 一 下 调用 这 个 方法 会 出 现 什么 情况 。 假 设 已 经 在 
main 畏 数 里 定义 了 一 个 Linked 对 象 ， 例 如 
Linked<string> sneakerList; 


这 时 调用 了 缺 省 构造 器 ， 因 此 得 到 : 


sneakerListhead ^ sneakerList.length 


NULL 


现在 在 sneakerList 的 前 面 添 加 一 个 项 : 

sneakerList.push front("Nike"); | 

这 个 消息 的 功效 是 创建 一 个 sneakerList.head 指 向 的 Node 对 象 。 这 个 节点 的 item 字 段 将 包 
含 值 Nike ` 。 节 点 的 next 字段 不 指向 任何 地 方 ， 因 此 它 的 值 是 NULL 。 当 然 ， 
sneakerList.length 也 必须 相应 增加 。 这 得 到 了 : 


sneakerList.head sneakerList.length 
= m 


再 一 次 ， 所 要 人 的 一 可 就 是 在 sneakerList 的 前 面 添加 一 个 项 | 


sneakerList push_front("Adidas"); 


首先 ， 将 创建 一 个 新 的 Node 对 象 。 当 然 ， 这 里 并 不 希望 sneakerList.head 指 向 这 个 新 节点 ， 
因为 这 样 将 导致 带 有 “Nike” 的 节点 不 可 访问 了 。 而 采用 的 方法 是 在 创建 新 的 Node 对 象 时 ， 


“ 令 一 个 Node 指 针 newHead 指 向 它 。 新 节点 的 item 字 段 得 到 值 “Adidas”。 新 节点 的 next 字 段 指 


向 最 初 的 节点 (item 字段 中 值 是 “Nike” 的 节点 )。 现 在 得 到 |: 
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sneakerList.head 


newHead 


最 后 ， 在 sneakerList.head 中 存储 地 址 ， 这 也 是 newHead 里 的 地 址 : 


sneakerList.head 


sneakerList.length 


根据 迄今 为 止 所 学 到 的 ， 应 当 可 以 解决 所 有 容器 项 的 存储 问题 : 将 每 个 项 输入 到 一 个 
Node 对 象 ， 再 把 它 插 入 到 Linked 对 象 的 前 面 。 这 里 是 push_ front 的 完整 的 定义 : 
void push_front(const T& newltem) 
Node* newHead=new Node; 
newHead->item=newltem; 
newHead->next=head; 
head=newHead; 
length++; 
y//71ikpush front 
这 个 例子 过 于 简单 8 因为 Linked 类 只 有 很 少 的 功能 ， 在 实际 的 应 用 中 可 能 需要 一 个 方 
法 删除 Linked 对 象 中 前 面 的 项 ， 并 且 可 能 希望 用 户 能 够 访问 列表 中 的 每 个 项 。 但 是 还 需 不 需 
要 一 个 方法 来 输出 项 ， 另 一 个 方法 来 查找 最 大 的 项 ， 等 等 ? 2.3. SHEERS 它 是 循环 
通过 一 个 容器 全 部 项 的 问题 的 完美 解答 。 
Linked 实 现 中 的 要 点 是 链 式 结构 存储 容器 项 和 数组 结构 有 几 个 关键 不 同 : 
D) 不 需要 提前 知道 容器 的 大 小 ， 可 以 随意 地 添加 项 s 因此 不 必 像 在 数组 中 一 样 ， 担心 分 
配 的 空间 过 多 或 过 少 。 但 是 应 当 注 意 到 ， 在 每 个 Node 对 象 里 ， ._ next 字段 自身 都 占据 了 额外 的 
空间 ， 因 为 它 所 容纳 的 是 程序 信息 而 不 是 问题 的 信息 。 
2) 随机 访问 是 不 能 实现 的 。 要 创建 方法 找到 一 个 项 ， 应 当 从 访问 hpad 顶 《 即 ，head 指 向 
的 Node 对 象 中 的 item 字 段 ) 开始 ， 然 后 访问 头 项 的 下 一 项 ， 依 次 类 推 。 


2.3.3 ARA 


从 2.3.2 节 可 以 看 出 ， 为 了 使 Linked 类 有 应 用 价值 BR UMURRI A Linkedg 
8b. EREE RERE, 也 就 是 说 不 允许 用 户 代码 访问 Linked 类 的 实现 细节 的 前 提 下 ， 
这 是 怎样 实现 的 呢 ? 答案 是 用 户 的 选 代 器 。 选 伐 器 是 一 个 对 象 ， 蕊 允许 容器 的 用 户 循环 通过 
容器 且 不 违背 数据 抽象 原理 ， 

适 代 器 允许 用 户 代 码 御 环 通 过 一 个 容器 且 不 访问 容器 类 的 实现 细节 
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迭代 器 类 还 必须 提供 什么 其 他 的 方法 来 循环 通过 一 个 容器 呢 ? 还 需要 一 个 迭代 器 运算 符 
一 -Operator++， 它 将 调用 的 友 代 器 对 象 前 进 到 容器 的 下 一 项 。 如 果 和 挝 代 器 位 于 最 后 一 项 ， 
operator++ 将 把 迭代 器 定位 到 最 后 一 项 之 后 的 位 置 上 。 另 外 ， 也 应 该 有 一 个 迭 代 器 的 
operator" H T3 [C28 2 ni br E. ERU SIL. Beg. x Xf operator--s$10operator!-3z 
算 符 方 法 测试 迭代 器 的 相等 和 不 等 情形 。 

下 面 的 main 拖 数 阐述 了 薪水 的 Linked 容 器 上 迭代 器 的 使 用 。 程 序 读 入 一 列 薪水 ， 然 后 输 
出 高 于 平均 薪水 的 每 个 薪水 值 。 薪 水 值 使 用 push_front 方 法 存放 在 Linked 容 器 中 ， 然 后 一 个 和 迭 
代 器 循环 通过 Linked 容 器 并 输出 大 于 平均 薪水 的 每 个 薪水 值 。 

TEE uA: 

int main( ) 


{ 
const string PROMPT = 


"Please enter a salary; the sentinel is "; 


const string RESULTS = 
"Here are the above-average salaries:"; 


const string CLOSE_WINDOW_PROMPT = 
"Please press the Enter key to close this output window. "; 


const float SENTINEL = —1.00; 
Linked<float> salaryList; 


float salary, 
total = 0.00; 


cout << PROMPT << SENTINEL << ": " 
cin >> salary; 
while (salary != SENTINEL) 
(| | 
salaryList.push front (salary); 
, total += salary; 
cout << PROMPT << SENTINEL <<" 
cin >> salary; 
} / 读 入 并 合计 薪水 
float average: 
if (salaryList.size( ) > 0) 
average = total/salaryList.size( ); 
Linked<float>::Iterator itr; 


cout << RESULTS << endt: | 
for (itr — salaryList.begin( ); itr !— salaryList. end( ); itr+ +) 
if (“itr > average) 
cout << *itr << endl: 
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cout << endl << endl << CLOSE WINDOW PROMPT; 
cin.get( ); 
cin.get( ); 
return 0; 
) // main 


特别 需要 注意 的 是 itr 的 声明 : 


Linked<float>::lterator itr; 


一 般 情 况 下 ， 对 每 个 容器 类 而 言 ， 它 的 选 代 器 类 被 嵌 进 了 容器 类 中 ; 这 是 之 所 以 需要 作 


用 域 解析 运算 符 的 原因 。 和 迭代 器 类 提供 了 刀 历 容器 类 的 方法 。 换 句 话说 ， 运 代 器 类 是 幕后 工 
作者 ， 它 使 得 容器 类 的 用 户 能 循环 通过 一 个 容器 ， 


2.3.4 ”lterator 类 的 设计 和 实现 


现在 开发 支持 Linked 类 的 Iterator 类 。 由 于 C++ 的 效率 难题 ， 所 以 将 结构 Node 对 象 和 
Iterator 类 峰 入 Linked 类 。 因 此 只 要 简单 地 指定 字段 ，Linked 的 方法 就 可 以 访问 Node 或 者 
Iterator 的 任意 字段 。 在 创建 Iterator 类 时 ， 也 需要 扩展 Linked 类 (例如 ，begin0 和 end() 方 法 ). 

下 面 是 Linked 类 的 大 体 轮 万 : 


template<class T> 
class Linked { 


protected: 
struct Node 
{ 
T item; 
Node" next; 
y; // 结构 Node 


. Node* head; 
long length; 


public: 
i glass erator C 


// 公有 、 私 有 和 受 保护 的 迭代 器 成 员 


)/ 类 Tterator 
/ Linked 类 的 方法 的 定义 


) // 类 Linked 


简化 的 Iterator 类 有 一 个 字段 : 
Node* nodePtr: 


用 一 个 Iterator 构 造 器 初始 化 nodePtr: 


IRER: 通过 newPtr 初 始 化 迭代 器 ， 
iterator(Node* newPtr) 


{ 
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nodePtr=newPtr; 
》/ 构 造 器 
这 个 构造 器 不 应 当 是 公有 的 ， 因 为 用 户 不 应 访问 Node 类 。 但 是 在 第 1 章 中 曾 提 到 ， 只 要 一 
个 类 有 任何 的 构造 器 ， 就 不 会 自动 定义 缺 省 构造 器 。 因 此 将 显 式 地 定义 一 个 公有 缺 省 构造 右 ， 
这 样 用 户 可 以 构造 一 个 Iterator 对 象 。Iterator 类 的 定义 部 分 是 
public: 
1/ 后 置 条 件 : 构造 这 个 lterator 对 象 。 
lterator(0{}// 缺 省 构造 器 
后 加 运算 符 一 -operator++(int) 的 定义 分 三 步 。 首 先 ， 为 一 个 临时 Iterator 对 象 temp 赋 一 
个 调用 对 象 的 值 ; 然后 增加 nodePtr; 最 后 ， 返 回 temp。 调 用 对 象 的 赋值 反映 了 C++ 的 一 个 
灵巧 的 特点 ，this 指 针 。 在 一 个 方法 中 ， 关 键 字 this 指 向 调用 对 象 ， 因 此 *this 就 是 调用 对 
象 自 身 。 
怎样 “增加 ”指针 nodePtr 呢 ? 答案 是 令 nodePtr 指 向 下 一 个 Node 对 象 ， 也 就 是 ， 利 用 赋值 
语句 : 
| nodePtr-(*nodePtr).next; 
下 面 是 代码 : 
// 前 置 条 件 : 这 个 lterator 对 象 定位 于 某 一 项 。 
// 后 置 条 件 : 这 个 lerator 对 象 在 Linked 对 象 中 前 进 ， 并 返回 调用 前 迭代 器 
IN CAM, 
Iterator operator++(int) 
{ 
Iterator tempz"*this; 
nodePtrz(*nodePtr).next; 
return temp; 
MH/ 后 加 ++ 


虚 参 数 类 型 int， 用 来 表示 运算 符 ++ 的 后 加 版 本 。 实 验 5 包 含 了 后 加 运算 符 的 定义 和 
Iterator 类 的 其 他 几 个 运算 符 。 


实验 5: 定义 其 他 的 迭代 器 运算 符 (所 有 实验 都 是 可 选 的 ) | 


2.3.5 pop_front 方 法 


Linked 类 中 另 一 个 有 用 的 方法 是 pop_front， 它 删除 容器 前 面 的 项 。 这 里 是 方法 接口 : 
// 前 置 条 件 ， 这 个 Linked 容 器 非 空 。 


// 后 置 条 件 : 这 个 Linked 容 器 前 面 的 项 已 被 删除 。 
void pop_front(); 


pop_front 的 一 种 可 能 的 定义 如 下 : 
void pop_front() 
{ 


head=(*head).next; 
--length; 
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HM/ 方法 pop_ftront 

这 个 定义 很 精致 ， 但 有 一 个 危险 的 缺陷 : 进行 调用 之 前 的 前 面 的 节点 现在 成 为 无 用 单 
元 a BE 但 不 再 是 可 访问 的 。 这 个 无 用 单元 可 以 不 断 堆 积 ， 并 最 终 导 致 程序 运 
行 的 内 存 效 出 。 解决 的 万 法 契 如 用 qelete 运 算 符 释放 不 使 用 的 空间 。 下 面 是 修正 后 的 
pop_front 版 本 : 


void pop_front() 
{ 
Node* oldHeadzhead; 
headz(*head).next; 
delete oldHead;//£&j$ *oldHead 
--length; 
}//pop_front 
oldHead 指 针 保 证 调用 开始 时 head 指 向 的 调用 的 开始 位 置 的 空间 不 被 释放 ， 直 到 调整 head 
之 后 。 而 且 oldHead 自 身 的 空间 将 在 pop_front 调 用 结束 后 自动 被 释放 。 


2.3.6 WR 


如 果 想 删除 所 有 Linked 容 器 的 项 怎么 办 ?一 种 方法 是 由 用 户 直 接 去 做 ， 壕 代 通 过 容器 并 
在 每 次 迭代 中 调用 pop_front。 更 好 点 的 主意 是 定义 一 个 destroy 方 法 ， 由 它 迭 代 通 过 容器 并 在 
每 次 迭代 中 调用 pop_front。 这 个 方法 的 问题 是 用 户 可 能 忘记 调用 destroy ， 特 别 是 对 于 不 再 访 
问 的 容器 而 言 。 例 如 ， 如 果 在 一 些 方法 中 定义 了 一 个 Linked 对 象 ， 在 这 个 方法 执行 完 之 后 ， 
对 象 就 超出 作用 域 了 ， 也 就 是 ， 这 个 对 象 再 也 不 能 被 访问 了 。 

当 一 个 类 的 实例 超出 作用 域 ， 也 就 是 不 再 能 被 访问 到 时 ， 就 自动 调用 析 构 器 方法 。 

回忆 前 面 讨论 初始 化 对 象 时 说 过 ， 由 于 用 户 的 健忘 性 促使 C++ 的 开发 者 提供 了 构造 器 ， 即 
当 定 义 一 个 对 象 时 自动 调用 的 初始 化 方法 。 为 了 删除 超出 作用 域 的 对 象 ， 用 户 的 健忘 性 又 促 
使 C++ 的 开发 者 提供 了 一 个 析 构 器 它 是 一 个 方法 ， 当 对 象 超出 作用 域 时 ， 自动 调用 它 来 释 
放 对 象 的 空间 。 — 
| 析 构 器 的 头 以 ty 开始 ， 后 面 跟着 类 标识 符 ， 然后 是 圆 括号 。 例 如， 这 里 是 Linked 析 构 
器 的 方法 接口: | 


NI EI 释放 Linked 对 象 i 据 的 空间 。 
~Linked() ` 


注意 析 构 器 是 没有 返回 类 型 也 没有 参数 的 | 


下 面 是 完整 的 定义 : 
~Linked() 
{ 
while(head!=NULL) 
pop_front(); 
JW 析 构 器 


回忆 在 前 面 的 似 述 中 讲 过 ， 如 果 没 有 为 类 创建 构造 器 ， 那么 编译 器 将 自动 生成 一 个 。 
个 缺 省 构造 器 没有 参数 ， 并 只 是 为 类 的 每 个 对 象 字 段 而 调用 它 。 得 是 小 心 些 ! 如 果 创 建 了 任 
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Was, fm EE CREAR HE BRAM a a; 那么 如 果 需 要 就 必须 显 式 地 定义 一 个 缺 省 构造 
器 。 而 且 当 创建 给 定 类 的 一 个 子 类 时 将 需要 它 ， 因 为 子 类 构造 器 开始 时 会 自动 调用 它们 的 超 
AR RAG 438i BF © 

同 理 ， 如 果 没 有 为 类 创建 析 构 器 ， 编 译 器 将 自动 生成 一 个 。 这 个 缺 省 析 构 器 只 是 为 类 的 
每 个 对 象 字 段 而 调用 。 但 因为 Linked 类 中 没有 对 象 字段 ， 所 以 这 样 的 一 个 析 构 器 没什么 作用 。 
这 也 是 必须 再 定义 我 们 自己 的 析 构 器 的 原因 。 

最 后 ， 需 要 说 一 下 常量 标识 符 。 例 如 ， 假 设 在 Linked 类 的 声明 /定义 中 声明 了 下 面 的 语句 : 

protected: 

const static string HEADING; 

在 类 声明 之 后 和 #endif 之 前 不 会 出 现 这 个 标识 符 的 定义 。 定 义 必须 模板 化 ， 因 为 Linked 就 
契 一 个 模板 类 : 

template<class T> 

const string Linked<T>::HEADING="This is a linked list."; 

只 有 在 Linked 类 或 它 的 子 类 的 方法 里 才 可 以 访问 HEADING。 

实验 6 处 理 了 Linked 类 的 另 一 个 扩充 重 载运 算 符 operator=，。 


实验 6， 重 载运 算 符 operator= - (所 有 实验 都 是 可 选 的 ) 





2.37 市 说 明了 对 很 多 容器 类 而 言 有 大 量 的 预定 义 函数 可 以 实现 一 些 通用 的 工作 。 
2.3.7 通用 型 算法 


正如 不 应 重复 地 创建 已 经 存在 的 类 ， 在 创建 方法 时 也 不 应 定义 已 经 定义 过 的 方法 。 标 准 
模板 库 不 仅 提 供 了 大 量 有 用 的 容器 类 ， 而且 还 提供 了 大 量 的 函数 一 一 像 排序 、 查 找 、 找 贝 、 
雪 加 等 等 一 一 它们 可 以 应 用 在 容器 对 象 上 。 作 为 额外 收获 ,这些 函数 ( 称 作 通 用 型 算法 ) 可 
以 应 用 在 数组 上 ! 并 且 为 了 更 灵活 ， 所 有 的 通用 型 算法 都 是 模板 函数 。 

模板 函数 的 主要 思想 和 模板 类 是 相同 的 。 一 个 函数 的 模板 是 函数 定义 的 框架 ;模板 包括 
一 个 或 多 个 未 指定 的 类 型 。 当 调用 这 个 函数 时 指定 类 型 ， 这 样 编译 器 可 以 为 函数 生成 相应 的 
代码 。 例 如 ， 调 用 模板 函数 swap 可 以 交换 两 个 未 指定 类 型 的 变量 的 值 ; 这 个 类 型 可 以 是 容器 
(通过 重 载 运算 符 operator=) 或 者 甚至 可 以 是 int 类 型 的 。 下 面 是 直接 从 标准 模板 库 的 惠普 实 
现 的 文件 algorith.h 中 得 到 的 函数 定义 : 

template <class T> 


inline void swap (T& a, T& b) 
{ 





T tmp = a; 
a = b; 
b = tmp; 
} 
前 面 曾 讲 过 template 是 一 个 关键 字 ， 并 且 总 是 跟着 <class...>。 这 次 关键 字 class 后 面 的 
类 型 标识 符 T 是 未 定义 的 。 当 函数 调用 被 编译 器 翻译 成 机 器 语言 时 ， 变 元 的 类 型 就 取代 了 未 指 
定 类 型 。 类 型 标识 符 可 以 是 一 个 类 ， 像 string 、Employee 或 Linked; 也 可 以 是 一 个 简单 类 型 ， 
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像 int 或 double 。 无 论 何 时 调用 这 个 函数 时 ， 关 键 字 inline 总 是 告知 编译 器 直接 生成 机 器 代码 ， 
而 不 是 函数 调用 。 例 如 ， 假 设 有 : 


float x, 
y; 


swap (x, y); 
它 生 成 的 机 器 代码 将 和 下 面 代码 的 机 器 代码 相同 : 


float x, 
y; 


float tmp — x; 

X 二 Wi 

y = tmp; 

处 理 侯 入 了 消 数 的 效率 要 比 处 理 函 数 调用 的 高 很 多 ， 因 为 它 不 需要 将 变 元 传递 给 参数 ， 将 
控制 权 交 给 被 调用 的 函数 并 在 调用 完成 后 返还 控制 。 伐 入 函数 不 能 包含 循环 ， 而 且 必 须 是 无 
递归 的 (递归 将 在 第 4 章 介 绍 )。 | 

下 面 的 程序 swap.cpp， 先 交换 两 个 string 的 值 ， 然 后 又 交换 了 两 个 int 的 值 : 


#include <iostream> 


#include «algorithm // 定义 了 大 多 数 通 用 型 算法 
#include <string> 


using namespace std; 


int main( ) 


{ 
const string CLOSE_WINDOW_PROMPT = 


"Please press the Enter key to close this output window."; 


string S1 — "yes", 
s2 = "no" 
swap (s1, s2); 7 . 
cout << s1 << "" << s2 << endl: // 输出 :: no yes 


int i1 = 58, 
i2 = 902; 
swap (i1, i2); 
cout << i1 << "" << i2 << endi; // 输出 :: 902 58 
cout << endl << endl << CLOSE WINDOW PROMPT; 
cin.get( ); 
return 0; 
} // main 


邦 一 个 模板 函数 的 例子 是 合计 数组 中 元 素 的 值 。 在 这 个 程序 中 定义 了 函数 add_up 并 调用 
"PIX, 一 次 是 合计 double 类 型 的 数组 ， 为 一 次 是 合计 int 类 型 的 数组 。 
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#include <iostream> 
#include <string> // 声明 string 类 


using namespace std; 


/ 后 置 条 件 : 返回 a[0...n-1] 中 元 素 的 总 和 。 
template <class T > 
T add up (T af ], int n) 
{ 
T sum = 0; 
for (int i = 0; i < n; i++) 


sum = sum + a [i]; 
return sum; 
} // add up 


int main( ) 


{ 
const string DOUBLE_MESSAGE = 


“The sum of the doubles is"; 
const string INT_MESSAGE = 
"The sum of the ints is "; 
const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


const int SIZE1 = 5; 
const int SIZE2 = 20; 


double weight [SIZE1] = { 3.2, 3.1, 2.9, 3.1, 3.0 I» 
int count [SIZE2]; 


cout << DOUBLE MESSAGE << add up (weight, SIZE1) << endl 
<< endl; | 
// 输出 :: double 型 的 总 和 是 15.3 
for (int i = 0; i < SIZE2; i++) 
count [i] = i; 
cout << INT MESSAGE << add up (count, SIZE2) << endl 
<< endl; 
// 输出 :: int 型 的 总 和 是 190 
cout << end! << CLOSE WINDOW PROMPT; 
cin.get( ); 
return 0; 
) // main 


BUCH Radd upA— MAR: 它 只 能 用 于 数组 。 虽 然 迄今 为 止 只 介绍 了 -一 个 容器 类 
(Linked 类 )， 但 后 面 还 有 关于 容器 类 的 大 量 描述 。 央 此 最 好 是 有 一 个 模板 函数 ， 它 不 仅 能 计 
算数 组 中 各 项 的 合计 ， 而 且 能 计算 容器 对 象 中 各 项 的 合计 。 

这 样 的 函数 是 存在 的 。 它 就 是 numeric.h 文 件 中 定义 的 accumulate 函 数 。 下 面 列 出 了 完整 
的 定义 : 








并 代为 


/后 置 条 件 : 返回 init 和 容器 里 从 first 位 置 (包括 first) 到 last 位 置 
if (不 包括 last) 之 间 的 所 有 项 的 总 和 

template <class Inputlterator, class T>; 

T accumulate (Inputlterator first, Inputlterator last, T init) 


{ 
while (first != last) 
init = init + *first-- +; 
return init; 
) // accumulate 


XXI ABA PAT RAE AY: InputIterator 和 T。T 是 至 今 尚 未 定义 的 类 型 ， 初 始 值 、 返 回 值 
以 及 过 代 器 first 和 last 位 置 上 的 值 都 是 这 个 类 型 的 。 参数 first 和 last 的 类 型 是 inputIterator， 但 是 
一 个 输入 友 代 器 有 多 大 容量 呢 ? 一 个 输入 和 迭代 器 必须 能 够 : 

访问 (不 需要 修改 ) 容器 的 每 一 项 ; 

前 进 到 容器 的 下 一 项 ; 

判断 是 否 到 达 了 容器 的 末端 。 

和 输入 克 代 器 这 样 命 名 是 因为 它们 反映 了 读 一 个 输出 流 的 行为 。 输入 迭代 器 必须 支持 的 运 
算 符 只 有 : 

15 1K ae his | FA, Blloperator’; 

迭代 器 自 加 ， 即 operator++; 

迭代 器 相等 性 测试 ， 即 operator== 和 operator!=。 

注意 这 些 正 是 accumulate 用 在 first 和 last 和 迭代 器 上 的 运算 符 ! A ALinked 2k FH i meee 
类 包含 了 这 些 运算 符 ， 所 以 Iterator 类 就 是 刚才 定义 的 Inputiterator 的 广义 范畴 。 也 就 是 说 ， 
以 用 accumulate 合 计 Linked 容 器 中 的 项 。 前 1 面 提 到 的 Linked 方 法 begin() 和 endO 返 回 Iterator, N 

和 刚才 看 到 的 输入 迭代 器 的 作用 是 一 致 的 。 下 面 是 代码 : 


Linked<int> list; . 


int sum = accumulate (list.begin( ), list.end( ), 0); 


BS NGEG— MEGA, CTUMURRBAMASBHOAL, TUN 
用 在 数组 上 。 

模板 消 数 accumulate 是 通用 型 算法 的 一 个 例子 。 通用 型 算法 是 一 个 模板 函数 ， 它 可 以 应 用 
在 容器 对 象 和 数组 上 。 要 累加 数组 中 的 项 ， 需 要 的 全 部 变 元 是 指向 开头 的 指针 和 指向 最 后 一 
项 之 后 位 置 的 指针 ， 以 及 一 个 初始 值 。 前 面 讲 过 ， 其 实 一 个 数组 变量 自身 就 是 指向 数组 开头 
的 指针 。 因此 数组 变量 加 上 数组 的 大 小 就 最 指向 数组 最 后 后 一 项 之 后 位 置 的 指针 。 可 以 重 写 程 
RSS doubles SAL Alna OLN. REAM unix 并 将 两 个 add_up 
调用 替换 成 : 


cout << DOUBLE MESSAGE - << accumulate (weight, weight + SIZE1, 
0.0) << end! << endl; ; 


和 , 
cout << INT_MESSAGE << accumulate (count, count + SIZE2, 0) << endi . 
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<< endl; 


实验 7 进一步 探讨 了 一 般 的 通用 型 算法 和 具体 的 accumulate 国 数 的 多 功能 性 。 


实验 7: 更 多 关于 通用 型 算法 的 知识 (所 有 实验 都 是 可 选 的 ) 





这 一 章 的 最 后 将 从 用 户 角度 简单 看 一 下 容器 。 
2.3.8 数据 结构 和 标准 模板 库 


数据 结构 就 是 用 户 眼中 的 容器 。 

数据 结构 就 是 用 户 眼 中 的 容器 。 除 了 数组 ， 所 有 C++ 里 的 容器 都 是 某 些 容器 类 的 实例 ， 因 
此 对 数据 结构 的 兴趣 其 实 就 是 对 容器 类 的 兴趣 。 具 体 说 来 ， 容 器 类 的 用 户 可 以 : 

1) 创建 该 类 的 一 个 实例 。 

2) 调用 该 类 的 public 方 法 。 

开发 者 通过 提供 字段 和 方法 定义 完成 了 这 个 描述 ， 那 么 可 以 说 开发 者 实现 了 数据 结构 。 
例如 ， 如 果 关 注 Linked 类 的 方法 接口 ， 那 么 可 以 将 该 类 看 作 一 个 数据 结构 ; 但 是 如 果 关 注 具 
体 字 段 的 选择 和 方法 定义 ， 这 就 是 考虑 该 数据 结构 的 实现 。 

E iE TRAT 这 应 用 价值 的 数据 结构 。 在 标准 C++ 里 , 标准 模板 库 只 是 一 部 分 ， 
是 未 指定 数据 结构 的 实现 细节 。 编 译 器 的 编写 者 可 以 自由 地 提供 满足 给 定 容器 类 方法 接口 的 
任何 实现 ESETA 将 学 习 标 准 模板 库 的 数据 结构 以 及 每 个 数据 结构 可 能 的 实现 。 顺 便 
说 一 下 ， 几乎 所 有 的 容器 类 都 是 模板 化 而 且 包 含 一 个 关联 渤 代 器 类 的 ， 因此 这 些 话题 在 后 面 
的 章节 中 是 非常 有 用 的 。 


总 结 
指针 和 动态 变量 的 概念 对 深入 理解 C++ 是 非常 重要 的 。 一 个 相关 的 概念 是 通用 数组 指针 
定理 。 


通用 数组 指针 定理 


通常 情况 下 、 对 任意 数组 a 和 非 负 整数 i，a[i] 和 *(a+i) 是 等 价 的 。 





容器 类 是 一 个 类 ， 它 的 每 个 对 象 ， 即 该 类 的 一 个 实例 ， 都 由 多 项 的 集合 组 成 。 容 器 对 象 ， 
即 容 器 类 的 一 个 实例 ， 可 以 连续 存储 在 一 个 数组 或 一 个 链 式 结构 里 。 在 链 式 结构 存储 中 ， 每 
个 项 都 存 人 一 个 称 作 节 点 的 结构 ， 它 包含 了 一 个 指向 另 一 节点 的 指针 。 | 

几乎 和 每 个 容器 类 都 相关 的 是 迭代 器 类 。 和 迭代 器 是 允许 用 户 在 不 违背 数据 抽象 原理 的 前 
提 下 ， 循 环 通过 一 个 容器 的 对 象 。 大 部 分 迭代 器 类 拥有 下 面 的 运算 符 : | 


operator!= FE —A7S EAR BE AD KAR 2 ETT LR 
operator++ // 将 迭代 器 前 进 到 容器 的 下 一 个 位 置 
operator* /返回 迭代 器 位 置 上 的 项 


而 且 大 部 分 容器 类 有 一 个 begin() 方 法 和 一 个 end() 方 法 ，begin() 方 法 可 以 返回 位 于 容器 开 
始 处 的 迁 代 器 ，end() 方 法 返回 位 于 恰好 是 窜 器 末尾 的 下 一 个 位 置 的 迭代 器 。 
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Linked2& f 4 28 2$ 89— ^ dE ALA. EE, LinkedRA THA. | 
标准 模板 库 的 大 部 分 都 由 各 种 容器 类 的 方法 接口 组 成 。 编 译 器 的 编写 者 可 以 在 满足 方法 
接口 的 前 提 下 随意 地 实现 这 些 容器 类 。 [59 | 


习题 


2.1 a. 创建 一 个 int 类 型 的 Linked 容 器 intList。 向 intList 中 插入 五 个 整数 。 
b. 创建 itrr， 远 代 通 过 一 个 int 类 型 的 Linked 窑 器 。 
c. 输出 intList。 
d. 创建 两 个 int 类 型 的 Linked 容 器 一 一 oddList 和 evenList。 | 
e. 对 intList 中 的 每 一 项 ， 根 据 它 是 奇数 或 是 偶数 ， 分 别 将 它 的 拷贝 插入 到 oddList 或 是 
evenList# 。 
f. 输出 oddList 和 evenList。 
2.2 a. 创建 employeeList， 它 是 Employee 对 象 的 一 个 Linked 容 器 。 
b. 从 输入 中 读 人 五 个 和 雇员， 并 将 每 个 雇员 插 到 employeeList 的 前 面 。 读 人 第 6 个 雇员 ， 
他 的 姓名 是 “ZZZ” ， 薪 水 总 额 是 $100 000.00. 
c. 从 employeeList 中 输出 超过 第 六 个 雇员 薪水 总 额 的 每 个 雇员 的 姓名 和 薪水 总 额 。 


提示 使 用 迭代 器 。 


2.3 用 一 个 数组 实现 原始 的 (三 方法 ) Linked 类 。 开 始 时 ， 数 组 的 缺 省 容量 是 100， 每 当 
溢出 当前 容量 时 就 将 容量 加 倍 。 


ER 除了 一 个 数组 字段 之 外 ， 还 要 加 入 一 个 front 字 段 ， 它 保存 前 一 个 元 素 的 下 标 .， 
每 衬 入 一 个 元 素 就 为 front 加 1。 从 什么 意义 上 说 ， 这 种 方式 比 从 下 标 0 播 入 一 个 新 的 
ALK HF? 


2.4 解释 下 列 push_front 方 法 定义 错误 的 原因 : 


void push_front (const T& newltem) 
{ 
head = new Node; 
head —> item = newltem; 
head —> next = head; 
length+ +; 
)/ 方法 push front 


2.5 从 本 章 或 实验 4 到 实验 6 中 举 出 两 个 关于 Linked 类 方法 的 例子 ， 它们 不 使 用 Iterator 对 象 
循环 通过 容器 。 
2.6 在 Linked 类 中 ， 代 人 的 Iterator 类 没有 自 减 运算 符 一 一 Operator- -(int)。 实 际 上 ， 使 


用 lterator 的 当前 设计 和 实现 ， 不 可 能 定义 这 样 的 运算 符 ， 解释 原因 。 窜改 Jterator 类 ， 
使 它 可 以 定义 后 减 运 算 符 。 


编程 项 目 2.1: 扩展 Linked 类 
在 实验 6 中 ， 通 过 声明 和 定义 operator= 扩 充 了 Linked 类 。 这 里 是 另外 一 些 方法 的 方法 
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Eu: 


// 后 置 条 件 : 如 果 这 个 Linked 对 象 中 没有 项 就 返回 真 。 否 则 ， 返 回 假 。 
bool empty() const; 


IARR: 如 果 这 个 Linked 对 象 和 otherLinked 包 含 了 相同 顺序 的 相同 项 就 
// 返 回 真 ， 否 则 返回 假 。 
bool operator==(const Linked& otherLinked) const; 


/后 置 条 件 : 如 果 这 个 Linked 对 象 和 otherLinked 没 有 包含 相同 顺序 的 相同 项 
// 就 返回 真 ， 否 则 返回 假 。 
bool operator!=(const Linked& otherLinked) const: 
1) 定义 这 些 方法 。 
2) 使 用 一 个 main 函 数 ， 它 定义 并 操作 两 个 int 类 型 的 Linked 对 象 ， 以 此 来 测试 你 的 定义 : 
Linked<int> intList1, 
intList2; 
测试 应 包括 对 第 一 部 分 里 定义 的 每 个 方法 的 若干 次 调用 ; 对 每 个 返回 bool 值 的 方法 ， 应 
包括 一 个 返回 值 为 真 的 调用 和 一 个 返回 值 为 假 的 调用 。 还 需要 足够 的 输出 来 证 明 方 法 的 正 
确 性 。 
3) 重新 用 main 函 数 测试 定义 ， 这 下 定义 并 操作 两 个 Employee 对 象 的 Linked 对 铺 (需要 重 
载 Employee 类 的 operator== ): 
Linked<Employee> empListt, 
empList2; 
从 键盘 读 和 人 直到 到 达 结束 标记 ， 这 样 来 创建 这 两 个 Linked 对 象 。 多 次 调用 第 一 部 分 里 的 
每 个 方法 。 








第 3 章 ”软件 工程 简介 


今天 的 计算 机 比 起 我 们 出 生年 代 的 计算 机 功能 强大 了 很 多 。 如 果 用 芯片 上 晶体 管 的 数量 
作为 衡量 计算 机 能 力 的 标准 ， 那 么 自 1967 年 以 来 ， 计 算 机 的 能 力 几 乎 每 18 个 月 就 增强 一 倍 。 
这 个 惊人 的 统计 就 是 著名 的 摩尔 定理 ， 是 Intel 公 司 的 主席 一 一 Gordon Moore 于 1965 年 提出 的 
由 于 硬件 能 力 的 稳步 增长 ， 计 算 机 可 以 在 相对 短 的 时 间 内 解决 非常 复杂 的 问题 。 但 是 相对 大 
型 的 程序 开发 则 需要 系统 的 方法 。 一 般 ， 开 发 一 个 10 000 行 的 程序 比 开发 一 个 5000 行 的 程序 
AR sk HE PA AR 


目标 


D 理解 软件 开发 生命 周期 的 四 个 阶段 。 
2) 使 用 统一 建 模 语言 开发 依赖 关系 图 。 
3) 创建 方法 、 类 和 项 目的 测试 用 例 。 

4) 进行 方法 的 大 0 分 析 和 运行 时 间 分 析 。 





3.1 软件 开发 生命 膨 其 | | . 


为 了 使 编程 者 能 够 应 付 大 型 程序 的 复杂 性 ， 出 现 了 软件 工程 这 门 学 科 。 软件 工程 是 原理 、 
技术 和 工具 在 软件 生产 上 的 应 用 。 一 些 相关 的 概念 起 源 于 数学 (形式 化 的 大 0 分 析 )， 一 些 起 
源 于 物理 科学 (科学 方法 )， 还 有 一 些 起 源 于 工程 (项 目 生命 周期 )。 大 部 分 概念 将 在 本 音 进 
行 介绍 ， 另 外 在 实验 以 及 后 续 章节 中 也 会 进行 并 述 。 

“即将 学 习 的 模型 称 作 坎 件 开发 生命 周期 ， 它 是 构成 一 个 编程 项 目的 四 个 顺序 阶段 。 其 中 
一 些 阶段 还 可 以 分 成 若干 子 阶段 。 这 里 先 给 出 一 个 大 体 的 描述 ， 按照 时 间 先后 这 几 个 阶段 为; 

D 问题 分 析 : 仔细 地 阐明 将 要 解决 的 问题 。 

2) 程序 设计 : 决定 解决 问题 需要 的 类 ， 它 们 是 怎样 建立 关系 的 ， 以 及 在 没有 现成 可 用 类 
时 ， 确 定 类 的 方法 接口 和 字段 。 

3) 程序 实现 : 为 那些 不 是 现成 的 定义 方法 然后 验证 、 分 析 并 集成 类 。 

4) 程序 维护 : 对 前 面 阶段 的 成 果 进 行 修改 。 | 

生命 周期 很 少 是 顺序 的 过 程 .更 确切 地 说 ， 它 是 选 代 的 : 当 处 在 后 面 的 阶段 时 ， 常常 需 
要 重 做 前 面 阶段 的 部 分 或 全 部 工作 。 


3.2 问题 分 析 


假设 现在 给 出 了 问题 的 描述 。 这 个 揪 壕 可 能 很 简单 ， 甚 至 有 _ 些 模 相 不 清 但 是 在 构造 
一 个 程序 解决 问题 之 前 ， 必 须 清晰 地 理解 该 问题 。 问 题 分 析 阶 段 的 目标 就 是 要 清楚 地 了 解 到 
需要 做 什么 。 这 里 故意 省 略 了 如 何 解决 问题 。 MADE NESTE AST SS BH th DR 
这 个 广义 原理 就 是 著名 的 抽象 原理 | 


J 
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抽象 原理 
当 试 图 解决 问题 时 ， 应 当 把 做 什么 和 如 何 做 区 分 开 来 。 


把 做 什么 从 如 何 做 中 抽象 出 来 ， 可 以 避免 陷 人 一 些 细节 的 困扰 ， 这 些 细 节 可 能 是 后 面 的 
阶段 或 者 是 由 其 他 人 所 解决 的 问题 。 

问题 分 析 阶 段 的 大 部 分 工作 就 是 提供 功能 规格 说 明 : 根据 输入 和 输出 ， 用 详细 、 明 确 的 
语句 描述 了 程序 应 该 做 什么 。 规 格 说 明 应 该 回答 下 面 这 样 的 问题 : 

1) 输入 的 格式 是 什么 样 的 ? 输入 值 的 类 型 和 范围 是 什么 ? 

2) 输出 的 格式 是 什么 样 的 ? 输出 值 的 类 型 和 范围 是 什么 ? 

3) 即将 执行 什么 样 的 任务 ? 

4) 程序 会 不 会 是 交互 式 的 ， 也 就 是 输入 能 否 响 应 输出 ? 或 者 在 程序 运行 前 是 否 创建 输入 
文件 ?如 采 程 序 是 交互 的 ， 那 么 输入 结束 的 标志 是 什么 ? 

5) 怎样 处 理 输入 错误 ， 即 ， 将 执行 多 少 输 入 编辑 ? 交互 程序 的 一 个 优点 是 在 输入 错误 时 
能 输出 一 个 错误 消息 ， 因 此 用 户 可 以 立即 更 正 错 误 。 例 如 ， 下 面 的 规格 说 明 可 以 应 用 在 输入 
一 个 年 份 上 : | 

年 份 应 当 是 1800 到 2200 之 间 的 整数 (包括 两 端的 数 )。 年 份 的 输入 应 当 响 应 提示 "Please 
enter the year: ", | 

a. 如 朱 输 入 的 值 不 是 一 个 四 位 的 整数 ， 将 输出 错误 销 息 “Error —— the year entered is not 
a four-digit integer.” 

b. 如 果 输 入 的 值 是 一 个 四 位 整数 ， 但 是 不 在 1800~2200 的 范围 内 ， 输 出 的 错误 消息 是 
“Error —— the year entered is not in the range 1800—2200.” 

c. 每 次 输入 一 个 错误 的 年 份 值 时 ， 应 当 输出 相应 的 错误 消息 和 提示 。 

规格 说 明 不 接受 所 有 的 错误 输入 吗 ? 从 程序 开发 者 的 观点 来 看 ， 安 全 的 回答 是 “Yes”。 如 
采 程 序 失败 了， 不 管 是 意外 的 终止 或 是 生成 了 错误 的 输出 ， 编 程 者 总 是 最 大 的 嫌疑 对 象 。 编 程 
者 喜欢 构造 能 够 经 受 不 可 容忍 的 箭头 符号 之 类 的 输入 的 程序 。 也 就 是 说 ， 编 程 者 宁愿 构造 健壮 
的 程序 : 在 无 效 输入 时 程序 不 会 意外 终止 。 一 个 健壮 的 程序 允许 用 户 从 输入 错误 中 恢复 : 当 出 
现 错误 的 输入 上 时， 通报 用 户 错误 信息 和 提示 进行 正确 的 输入 一 一 通常 是 通过 输出 信息 实现 。 

但 是 关于 输入 编辑 的 最 终 决定 取决 于 客户 ， 他 是 程序 的 购买 者 。 在 某 些 情况 下 ， 比 如 国 
防 和 病人 的 监护 ， 意 外 的 终止 或 错误 的 输出 将 酿 成 重大 的 灾难 。 在 商务 环境 里 ， 基 于 错误 输 
出 做 出 的 决定 也 将 产生 损失 惨重 的 后 果 。 但 是 通常 情况 下 ， 一 些 输入 错误 可 以 安全 地 忽略 。 
例如 ， 假 设 要 为 一 个 医院 的 病人 制作 账单 。 客 户 〈 医 院 管理 人 员 ) 可 能 察觉 费用 过 于 昂贵 了 ， 
这 时 可 以 根据 编程 者 的 时 间 ， 检 查 病 人 的 医院 记录 的 每 个 字段 进行 更 正 ， 


系统 测试 


根据 给 出 的 规格 说 明 ， 创 建 样本 输入 值 并 手工 求 出 相应 的 输出 。 在 这 个 阶段 ， 样 本 输入 
和 样本 输出 的 主要 目的 是 确认 对 问题 的 理解 以 及 输入 输出 格式 。 稍 后 ， 在 书写 程序 之 后 ， 它 
们 还 可 以 作为 测试 用 例 ， 以 对 程序 运行 符合 规格 说 明 增强 信心 。 比 较 好 的 是 在 书写 程序 之 前 
而 不 是 之 后 生成 这 些 系 统 测试 ， 否 则 程序 书写 的 方式 将 不 知 不 觉 地 受到 测试 的 影响 。 

学 一 个 简单 的 例子 ， 对 计算 测验 成 绩 平均 值 的 程序 进行 下 面 的 系统 测试 。 样 本 输入 用 粗 











体 显 式 ， 以 区 分 输入 和 输出 。 

系统 测试 这 个 程序 计算 一 系列 测验 成 绩 的 平均 值 . 每 个 成 绩 必 须 是 0 和 100 之 间 的 整数 ， 
包括 0 和 100。- 1 用 来 作为 结束 标志 。 | 

Please enter a test score:80 

Please enter a test score:90 

Please enter a test score:700 

Error: The score must be an integer between 0 and 100, inclusive. 

Please enter a test score:70 

Error: The score must be an integer between 0 and 100,inclusive. 

Please enter a test score:70 

Please enter a test score:— 1 

The mean is 80.0. 

开发 全 面 的 系统 测试 是 一 项 艰难 、 费时 的 工作 如 有 果 朴 漏 了 一 个 临界 的 测试 ， 程 序 可 能 
会 包含 错误 ， 根 据 摩尔 定理 ， 这 个 错误 可 能 在 最 不 适宜 、 最 昂贵 的 时 刻 显 露出 来 。 

开发 规格 说 明和 系统 测试 的 人 是 系统 分 析 员 。 系 统 分 析 员 有 几 个 职责 。 首 先 ， 系 统 分 
析 员 必须 理解 终端 用 户 ( 即 最 终 运行 程序 的 人 ) 的 需要 。 其 次 ， 系 统 分 析 员 和 客户 必须 在 


将 要 解决 的 问题 上 形成 共识 。 最 后 ， 系 统 分 析 员 必须 能 够 为 编程 者 提供 一 个 明确 、 详 细 的 = 


问题 描述 。 

所 有 的 这 些 交流 都 可 以 利用 文档 进行 。 明 确 的 文档 ， 像 功能 规格 说 明 ， 趋 向 于 排除 后 面 
的 分 歧 ， 像 所 说 过 的 观点 和 谁 从 成 这 个 观点 。 文 档 提供 了 项 目 中 除 程序 源 代码 之 外 的 惟 _ 可 
见 的 证 据 。 在 问题 解决 过 程 的 后 面 阶段 还 会 看 到 其 他 类 型 的 文档 。 

创建 规格 说 明和 系统 测试 之 后 ， 下 一 个 阶段 是 设计 解决 问题 的 程序 。 


3.3 程序 设计 


在 这 个 阶段 要 决定 需要 什么 样 的 类 来 解决 问题 ， 以 及 这 些 类 之 间 是 如 何 建立 联系 的 。 不 
稚 张 地 说 ， 编 程 者 在 这 个 阶段 花费 的 努力 将 最 大 程度 地 影响 整体 项 目的 成 功 。 一 个 公司 可 以 
有 数 干 个 可 用 类 ， 如 果 其 中 一 个 类 适用 于 项 目 ， 而 开发 者 没有 发 现 这 个 类 ， 那 么 可 能 会 浪费 
数 百 个 小 时 来 重新 创建 这 个 类 。 用 几 小 时 浏览 软件 库 ， 就 可 以 找到 准时 、 TERN AES 
超 预 算 项 目 之 间 的 差别 。 个 要 做 重复 的 工作 ! 


3.3.1 方法 接口 和 字段 


使 用 那些 已 在 应 用 的 类 是 简单 而 令 人 高 兴 的 。 eases ENBASRIBT. 标准 模 
板 库 提 供 了 一 些 必要 的 类 。 事 实 上 ， 对 所 有 的 项 目 而 言 至 少 需要 创建 一 个 类 。. 对 每 个 这 样 
的 类 ， 先 列举 出 类 的 职责 : 即 类 必须 提供 给 用 户 的 服务 ， 将 这 些 职责 精炼 成 方法 接口 。 还 需 
要 决定 类 的 字段 ， 但 是 将 方法 定义 推迟 到 程序 实现 阶段 ， 换 句 话说 ， 在 设计 时 开发 头 文件 ， 
在 实现 阶段 开发 源 文 件 。 

例如 ， 在 第 1 章 的 最 高 薪水 雇员 的 问题 上 ， 指出 了 Employee 类 的 下 列 职责 : 

把 一 个 雇员 的 姓名 初始 化 为 空 ， 薪 水 总 额 初 始 化 成 0.00。 

读 和 一 个 雇员 的 姓名 和 薪水 总 额 。 








52 E3x* 


判断 是 否 到 达 了 结束 标志 。 

判断 一 个 导 员 的 薪水 总 额 是 否 高 于 另 一 些 雇员 的 薪水 总 额 。 
获取 一 个 导 员 的 姓名 和 薪水 总 额 的 持 贝 。 

输出 一 个 雇员 的 姓名 和 薪水 总 额 。 

然后 将 这 些 职责 精炼 成 方法 接口 : 


// 后 置 条 件 : 这 个 Employee 的 姓名 被 设置 成 一 个 空 字符 串 ， 薪 水 总 额 被 设置 
// FX 0.00, 
Employee(); 


UERR: 读 入 这 个 Employee 的 姓名 和 薪水 总 额 ， 


void readinto(); 


HARR: 如 果 这 个 Employee 是 结束 标志 就 返回 真 。 否 则 ， 返 回 假 。 
bool isSentinel() const; 


// 后 置 条 件 : 如 果 这 个 Employee 的 薪水 总 额 比 otherEmployee 的 高 就 返回 真 。 
/否则 ， 返 回 假 。 
bool makesMoreThan(const Employee& otherEmployee) const: 


I RR Af; 这 个 Employee 包 含 了 otherEmployee 的 一 个 拷贝 。 
void getCopyOf(const Employee& otherEmployee): 


// 后 置 条 件 : 输出 这 个 Employee 的 姓名 和 薪水 总 额 。 
void printOut() const; 
方法 的 开发 者 和 使 用 者 之 间 瞳 金 了 一 种 合约 。 
一 个 方法 的 前 置 条 件 和 后 置 条 件 构 成 了 方法 的 开发 者 和 使 用 方法 的 编程 者 之 间 的 合约 。 
如 采用 户 在 调用 方法 之 前 确认 满足 了 前 置 条 件 ， 那 么 开发 者 就 能 保证 方法 将 最 终结 束 并 且 结 
束 时 后 置 条 件 为 真 。 ARTEA DRI E AMT RREN T AA, 开发 者 就 没有 责 
任 保证 结果 : 错误 的 答案 ， 程 序 崩 省 ， Ute 
”Employee 类 有 两 个 字段 : | 
string name; | 
double grossPay; 


需要 的 另 一 个 类 是 Company ， 它 的 职责 是 寻找 薪水 最 高 的 雇员 ， 并 输出 这 个 雇员 的 姓名 
和 薪水 总 额 。 方 法 接口 是 


/后 置 条 件 : Mit Company S SIG ES RA. 

void findBestPaid() | 

/后 置 条 件 : ibit t Company GS RR S o EN. 

void printBestPaid(); 

在 Company 类 中 ， 惟 一 的 字段 是 : 

Employee bestPaid; 

方法 接口 是 文档 化 设计 决策 时 方法 层次 上 的 工具 。3.3. 2 市 介绍 类 层次 上 的 文档 工具 。 
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3.3.2 依赖 关系 图 


类 的 关系 文档 的 重要 工具 是 依赖 关系 图 。 依 赖 关 系 图 是 一 个 表格 ， 它 体现 了 项 目 中 类 之 
间 、 字 段 之 间 和 调用 对 象 之 间 的 依赖 关系 。 说 明 这 些 关 系 的 符号 来 自 统 一 建 模 语 言 ， 它 是 一 
个 工业 标准 化 语言 ， 集 中 了 当前 软件 工程 中 处 理 系 统 建 模 的 实践 。 例 如 ， 如 果 类 A 是 类 B 的 一 
个 子 类 ， 就 从 A 到 B 画 一 个 实心 的 箭头 。 图 3- 1 包含 了 最 高 计时 新 水 雇员 的 问题 设计 的 部 分 依 
HERE. 


Company Employee. 


| 


Company2 HourlyEmployee 





图 3-1 最 高 计时 薪水 雇员 的 问题 设计 的 部 分 依赖 关系 图 
类 的 对 象 字 段 和 该 类 的 调用 对 象 之 间 的 依赖 关系 要 复杂 些 。 假 设 有 下 面 的 代码 : 


class X 


{ 
Y y; 


y; // 类 X | 


XX HL EDS JE BRE 0: 

1) 复 会 。 当 回收 (或 者 说 重新 分 配 ) X 类 型 的 对 象 的 空间 时 ， 也 同样 回收 对 象 y 的 空间 。 
换 句 话说 ，y 的 存在 依赖 于 X 的 对 象 。 

2) 聚合 。 当 回 收 X 类 型 的 对 象 的 空间 时 ， 不 回收 对 象 y 的 空间 。 换 句 话说 ，y 的 存在 不 依 

MTX. 

例如 ， 在 Employee 类 里 ， 只 有 调用 Bmployee 的 对 象 存在 时 name 对 象 才 存在 。 回 想 第 2 
章 中 ， 如 果 一 个 类 没有 显 式 的 析 构 器 ， 就 由 编译 器 给 出 一 个 隐 式 析 构 器 ， 这 个 隐 和 式 析 构 器 只 
是 ( 显 式 或 隐 式 地 ) 为 类 的 每 个 字 段 调用 析 构 器 。 因此 当 一 个 Employee 对 象 超出 作用 域 时 ， 
它 的 name 字 段 的 空间 就 被 回收 。 即 , name 对 象 依赖 于 调用 Bmployee 的 对 旬 ， 这 就 是 复合 情况 
的 例子 。 

为 了 描述 统一 建 模 语 言 中 的 复合 ， 从 封装 类 向 字段 画 一 个 箭头 ， 箭头 的 开端 是 一 个 实心 
的 菱形 。 图 3- 2188) Tnameat HH Employee AM RARE beu Company AM EAM (也 
是 复合 关系 ) 。 

当 持 装 类 的 一 个 方法 返回 了 指向 字段 对 象 的 指针 时 就 发生 到 合 。 例如 ， 使 用 下 面 的 代码 : 


class X 


{ E 
protected: 
Yy; 
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public: 
Y* sendit( ) 
{ 
return &y; 
) // ÀA iksendlt 


Q /类 X 







bestPaid 






* 
Company 





+ 
Employee 


图 3-2 统一 建 模 语言 中 复合 的 依赖 关系 图 。name 对 象 依赖 于 调用 的 
Employee 对 象 ，bestPaid 对 象 依 赖 于 调用 的 Company 对 象 


在 这 种 情况 下 ， 当 回收 调用 的 X 对 象 时 并 不 希望 回收 y 的 空间 ， 因为 sendIt 返 回 了 一个 指向 
y 的 指针 。 当 调用 的 X 对 象 的 存储 空间 被 回收 时 ， 那 个 返回 的 指针 可 能 仍 存在 。 为 了 保证 回收 
X 的 空间 时 还 能 够 访问 到 y 对 象 ， 封 装 类 必须 有 一 个 显 式 析 构 器 ， 它 不 回收 y 的 空间 。 
在 统一 建 模 语言 里 ， 聚 合用 封装 类 指向 字段 对 象 的 箭头 描述 ; 箭头 的 开端 是 一 个 空心 的 
[70] 菱形 。 图 3- 3 说 明了 刚才 讨论 的 例子 中 的 聚合 . 


XQ — —— 一 


图 3-3 ”对 统一 建 模 语言 中 聚合 的 说 明 。 当 调用 的 对 象 X 的 
存储 空间 被 回收 时 ， 对 象 y 的 空间 不 会 被 回收 


在 C++ 中 ， 由 开发 者 决定 是 应 用 复合 还 是 应 用 聚合 〔 例 如 类 X )， 这 个 决定 确定 了 类 是 否 
应 该 有 一 个 显 式 的 析 构 器 ， 如 果 需 要 ， 那 么 写 出 它 的 定义 。 
一 且 完 成 了 设计 ， 就 可 以 开始 实现 阶段 的 工作 。3.4 节 讨论 了 这 个 阶段 。 程 序 设计 阶段 的 
最 后 部 分 一 确定 每 个 类 的 字段 一 -有 时 被 看 作 是 程序 实现 阶段 的 一 一 部 分 。 这 个 区 别 并 没有 什 
么 实际 意义 ， 下 为 入 囊 生计 和 实现 的 通常 是 同一 个 开发 小 组 ， 


3.4 程序 实现 


在 这 个 阶段 ， 首 先 ， 通 过 提供 方法 的 定义 ， 完 成 每 个 新 类 的 定义 。 然 后 判断 类 的 每 个 方 
法 的 正确 性 和 效率 。 当 我 们 很 有 把 握 相 信 一 个 方法 在 局 部 运行 很 好 时 ， 就 可 以 考虑 它 和 类 的 








其 他 方法 的 适应 程度 以 及 该 类 和 项 目的 其 他 类 的 适应 程度 。 之 所 以 先 考 虑 方法 的 正确 性 ， 是 
因为 一 个 不 正确 的 方法 是 毫 无 价值 的 ， 而 一 个 效率 低 的 方法 可 能 是 可 以 使 用 的 。 
3.4.1 市 讨论 如 何 能 对 方法 的 正确 性 有 信心 。 


3.4.1 方法 验证 


想 增 强 对 方法 正确 性 的 信心 ， 最 常用 的 技术 是 验证 方法 ， 也 就 是 说 ， 用 很 多 字段 及 参数 
《如 果 方 法 包含 任何 输入 语句 的 话 ， 还 有 和 输入) 的 样本 值 测试 方法 。 然 后 可 以 比较 实际 结果 和 
方法 后 置 条 件 的 预期 结果 。 

例如 ， 假 设想 测试 第 ! 章 中 描述 的 Date 类 的 next0 方 法 。 应 当 特 别 谨慎 地 确保 方法 在 边界 
值 ， 比 如 一 个 月 的 最 后 一 天 、 一 年 的 最 后 一 个 月 等 处 运行 正确 。 如 表 3-1 所 示 ， 这 里 给 出 了 一 
些 测 试 数据 : 


表 3-1 测试 数据 | 
调用 对 象 的 样本 值 | next() 的 预期 结果 
H H 年 H 月 年 
17 11 2003 18 11 | 2003 
30 11 2003 1 12 2003 
31 12 2003 l 1 2004 
28 2 2000 29 2 2000 
2 2003 - 1 3 2003 
28 2 . 2004 29 | 2 2004 
2 2100 | l 3 | 2100 
$a 
表 的 最 后 四 行 行 反映 了 地 球 围绕 太阳 公转 近似 为 365. 2425 天 这 个 事实 。 半年 是 指 可 以 被 4 整 
除 ， 且 不 能 被 100 整 除 ， 或 者 能 被 400 整 除 的 年 份 。 
”如 果 next0 方 法 通过 了 这 些 测 试 ， 就 会 增强 对 这 个 方法 正确 性 的 信心 。 但 是 还 不 能 肯定 方 
法 的 正确 性 ， 因为 并 没有 尝试 所 有 可 能 的 测试 。 通常 ， 运 行 所 有 可 能 的 测试 几乎 是 不 可 能 的 ， 
因此 可 以 只 根据 测试 来 推断 正确 性 。 正如 E.W.Dijkstra 曾 说 的 ， 测试 可 以 揭示 错误 的 存在 但 不 
anm AO 
测试 的 另 
SABBATO 己 的 工作 (例如 “一 个 杰作 “个 永远 美丽 、 令 人 高 兴 的 东西 ”， 
世界 的 第 八大 奇迹 ” )。 正 因 如 此 ， 编 程 者 不 适合 测试 他 们 自己 的 方法 ， 因 为 测试 的 目的 是 揭 
mi. 实际 上 构造 测试 数据 的 人 应 当 希 望 方法 不 能 通过 测试 在 一 个 班级 中 ， 教师 是 比较 
满足 这 个 标准 的 人 ! S | 
如 果 一 个 关 只 有 一 个 方法 ， 可 以 设立 一 个 测试 主体 来 孤立 地 处 理 这 个 方法 更 常见 的 情 
况 是 一 个 类 有 多 个 方法 ， 需 要 对 它们 进行 一 致 的 测试 。 例 如 ， 需要 宰 试 方法 m10 之 后 再 测试 
方法 m2()， 还 要 先 测试 m2() 再 测试 m1()。 跨 动 厂 是 一 个 程序 ， 创 建 它 就 是 为 了 专门 测试 一 个 
类 中 的 方法 。 成 品 强度 驱动 器 可 以 更 广阔 地 测试 方法 ， 它 比 普通 的 、 特别 是 测试 单个 方法 的 
驱动 器 要 复杂 得 多 。 关于 驱动 器 的 知识 将 在 实验 8 中 继续 讨论 。 
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实验 8: 驱动 器 (所 有 实验 都 是 可 选 的 ) 


正如 类 通常 不 止 有 一 个 方法 一 样 ， 一 个 项 目 往 往 也 不 止 有 一 个 类 。 对 一 个 多 类 的 项 目 ， 应 
当先 测试 哪个 类 ?在 面向 对 象 的 环境 中 ， 常 用 的 是 自 底 向 上 的 测试 。 使 用 自 底 向 上 测试 ， 一 
个 项 目的 低层 次 的 类 (就 是 可 以 被 其 他 类 使 用 但 不 使 用 其 他 类 的 类 ) 首先 被 测试 ， 然 后 再 结 
合 高 层次 的 类 ， 依 次 类 推 。 在 项 目的 每 个 类 都 满足 这 个 测试 之 后 ， 可 以 运行 系统 测试 ， 也 就 
是 将 项 目 作为 一 个 整体 进行 测试 。 前 几 个 系统 测试 的 输入 作为 问题 分 析 阶 段 的 一 部 分 来 提供 。 
如 琳 项 目 通 过 了 这 些 测试 ， 就 进行 另外 的 测试 ， 直 到 确信 项 目 是 正确 的 ， 即 它 满足 规格 说 明 . 

测试 的 目的 是 检测 程序 中 的 错误 (或 者 是 增强 对 程序 中 不 存在 错误 的 信心 ) 。 当 测试 显示 
出 程序 中 存在 错误 ， 必 须 马 上 判断 是 什么 导致 的 错误 。 这 可 能 是 一 些 严谨 的 探测 工作 所 必须 
的 。 探 测 的 目的 是 修正 。 整 个 验证 阶段 一 一 测试 、 探 测 和 修正 一 一 是 迭代 的 。 一 旦 修正 了 一 个 
错误 ， 应 当 重 新 开始 测试 ， 因 为 这 个 “修正 ”可 能 产生 了 新 的 错误 。 


3.4.2 正确 性 实现 的 可 行 性 


正如 本 章 开头 所 述 ， 近 年 来 的 发 展 趋势 是 软件 功能 日 益 强 大 。( 近 期 有 个 广告 将 大 型 程序 定 
区 为 ”有 超过 百 万 行 代码 ”的 程序 *) 但 是 在 开发 中 一 直 缺 少 资深 的 系统 分 析 员 和 编程 员 ， 而 且 
在 项 目的 管理 上 常常 表现 得 急 燥 冒 进 。 因 此 ， 目 前 “完成 ”的 系统 中 都 不 可 避免 地 存在 错误 ， 

Eta tame 这 种 情况 是 难以 忍受 的 。 那 么 能 够 做 什么 呢 ? 首先 ， 也 是 
一 个 主要 的 转变 ， 就 是 管理 必须 对 软件 持 有 长 远 的 眼光 。 正 在 为 当前 项 目 开 发 的 类 还 不 确定 
IE ILES OR, RUE MEHR EM Cement A 
上 是 对 未 来 的 一 各 投资。 而且， 软件 开发 团队 的 每 个 成 员 都 必须 有 质量 的 压力 。 系统 分 析 员 
必须 努力 工作 ， 以 明确 地 指明 将 要 做 什么 。 程 序 员 需 要 在 正确 性 方面 继续 努力 。 整体 的 目标 

在 创建 一 个 环境 来 抵制 错误 ， 因 此 ， 将 来 软件 的 担保 将 像 硬件 的 担保 一 样 通用 。 

从 管理 的 观点 来 看 ， 完 美 总 是 和 利润 矛盾 的 。 如 果 开 发 团队 对 系统 正确 性 有 99% 的 自信 ， 
那么 这 个 系统 可 能 就 发 售 了 ， 然 后 利润 滚滚 而 来 。 要 是 延迟 到 有 100% 的 自信 才 发 售 ， 那么 将 
花费 非常 多 的 额外 的 时 间 ， 项 目的 利润 也 会 急剧 下 降 。 当 然 发 售 一 个 有 很 多 错误 的 系统 会 破 
坏 公 司 的 信用 ， 因此 必须 在 两 者 之 间 取 得 平衡 。 在 面向 对 象 的 环境 里 ， 与 其 说 是 正确 性 和 利 
润 的 矛盾 ， 不 如 说 是 短期 利润 和 长 期 利润 的 矛盾 。 

现在 已 经 看 到 了 方法 、 类 和 项 目的 验证 ， 下 面 将 注意 力 转移 到 它们 的 效率 的 评估 上 。 


3.4.3 方法 效率 评估 | 


方法 的 正确 性 只 是 依赖 于 方法 是 否 做 了 预想 的 工作 。 但 是 一 个 方法 的 效率 更 大 程度 上 依 
赖 于 方法 是 如 何 定义 的 。 怎样 衡量 效率 ? 可 以 在 这 个 特别 针对 该 任务 创建 的 程序 中 反复 地 编 
译 和 执行 方法 。 但 那样 的 分 析 将 依赖 于 编译 器 、 操 作 系 统 以 及 所 使 用 的 计算 机 在 这 个 阶段 ， 
希望 有 一 个 更 抽象 的 分 析 ， 它 可 以 直接 调查 方法 的 定义 。 那么 现在 的 问题 就 是 如 何 通过 方法 
定义 估算 一 个 方法 需要 的 运行 时 间 ? 

可 以 使 用 方法 的 跟踪 中 运行 的 语句 数量 作为 衡量 这 个 方法 需要 的 运行 时 间 的 标准 . 这 个 
标准 可 以 表示 成 问题 “大 小 ”的 函数 。 例 如 ， 对 一 个 排序 问题 而 言 ， 就 是 被 排序 的 什 的 数 且 ， 
一 般 说 来 ， 一 个 有 nn 个 输入 记录 的 问题 称 作 是 “大 小 为 n 的 … 








给 定 大 小 为 4 的 某 个 问题 的 方法 ， 令 worstTime(n) 是 方法 跟踪 中 执行 的 语句 的 最 大 数量 
(遍及 所 有 可 能 的 参数 和 输入 数值 )。 有 时 我 们 也 会 对 方法 在 平均 情况 下 的 性 能 感 兴趣 。 定 义 
averageTime(n) 为 方法 跟踪 中 执行 的 语句 的 平均 数量 。 这 个 平均 接收 了 方法 的 所 有 调用 ， 而 
且 假 设 z 个 问题 值 的 每 种 可 能 的 安排 都 是 相似 的 。 对 某 些 应 用 ， 最 后 这 个 假设 是 不 现实 的 ， 
此 averageTime(n) 可 能 不 是 很 准确 。 

有 了 时候， 特别 第 4 章 和 第 12 章 ， 还 要 估算 方法 的 存储 空间 需求 。 为 此 ， 把 worstSpace(n) 作 
为 方法 眼 踪 中 访问 的 变量 的 最 大 数量 ，averageSpace(n) 是 方法 跟踪 中 访问 的 变量 的 平均 数量 。 


3.4.4 KORTE 


人 们 并 不 需要 精确 地 计算 worstTime(n) 和 averageTime(n)， 或 者 worstSpace(n) 和 averageSpace(n)， 
因为 它们 只 是 相应 方法 的 时 间 、 空 间 需 要 的 近似 值 。 这 里 用 大 QO 表示 法 近似 这 些 函 数 。 因 为 是 单 
独 地 看 这 个 方法 ， 所 以 这 个 “近似 的 近似 ”能 很 好 地 说 明 方 法 将 有 多 快 的 速度 。 

大 0 表示 法 的 基本 观点 是 ， 我 们 经 常 希望 确定 一 个 函数 行为 的 上 界 ， 也 就 是 确定 函数 可 能 
运行 得 多 么 精 。 例 如 ， 假 设 给 定 一 个 函数 六 如 果 某 些 函 数 g 不 精确 地 说 是 /的 一 个 上 界 ,， 那 么 
就 称 f 是 8 的 大 O。 把 “不 精确 地 说 ” 换 成 “详细 解释 ”， 就 得 到 如 下 定义 : 


8 是 一 个 加 数 ， 它 有 非 负 整数 变 元 ， 并 对 所 有 的 变 元 返回 一 个 非 负 值 。 将 O(g) 定 义 
成 函数 /的 集合 ， 使 得 对 某 些 非 负 常数 C 和 开 ， 满 足 


AN A n> K, f(n) < Ce(n) 





如 采 / 是 在 248) 中 ， 就 称 是 “8g 的 0” 或 者 “/ 是 8 量 级 的 "。 

大 0 表示 法 的 主要 思想 是 :; .如 果 / 是 O(8)， 那 么 最 终 /就 限制 在 8 的 常量 倍数 上， 因此 可 以 使 
用 O(g) 作 为 函数 1 的 估算 上 界 。 MEE | 

通过 符号 的 标准 “ 亡 用 ”" ,通常 可 以 将 函数 和 它 所 计算 的 数值 关联 起 来 。 例 如 ， 令 g 是 下 
面 定 义 的 函数 : | | | 

g(n)=n? n=0,1,2,... 

ABZ LAH O(g RRO) 





8831. |. cnin 
令 /是 如 下 定义 的 函数 : 
fin) = n(n+3)+4 | 0,1,2,... 
UE PASE O(n’). 
Bu 
必须 找到 非 负 常数 C 和 天 ， 使 得 对 所 有 的 n> fm) < Cm?。 首 先 重 新 书写 函数 定义 : 
fln)=n?+3n+4 n=0,1,2... 
| RIEN + An > PEER BR LE IM 马上 可 知 : 
| | meln: . s. nO . 
gBn«&3m — | n»0 
4«4m - | onal 


Bu, 对 任意 n> l,- 
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fin <$ m-3m--4mzz8nm 
ALLE UL. S C-STHK-IBT, HATA Un K, WAEN) CR. xii HALON. 


AOL P. ARES SAI: 
an +a, un" + tanta, 
ABZ Fy LAs EXGTEK-I, C-ladla, +…+lail+tlaal， 进 行 如 例 3.1 所 示 的 计算 ， 得 到 /是 O0zo 的 。 
例 3.2 说 明 在 求 一 个 函数 的 级 时 可 以 忽略 对 数 的 底数 。 
例 3.2 — 
令 a 和 b 是 正 的 常数 。 证 明 如 果 f 是 O(logsn)， 那 么 f 也 是 O(logsn)。 
HE O 
Rif O(og.n), J3BZ.frfEdEfL BRCAIK, (BMA HIN > K, 
fin) < Clog,n 

根据 对 数 的 基本 属性 (参见 附录 1)， 
log,n = (log,b) (log,n) n>0 
&C,= Clog,b, 

fin) <Clog.n=C log.b log,n = Cog, 





Al tf de O(log,n). 
-一 一 一 -一 LLL 
注意 大 0 表示 法 只 是 给 出 了 一 个 函数 的 上 界 。 例 如 ， 如 果 / 是 Oo)， JB Z fb A O(n?+5n+2), 
CU) 和 OU"+3)。 应 当 尽 可 能 地 从 这 个 量 级 层次 中 选择 最 小 的 元 素 ， 最 常用 的 量 级 层次 如 图 3-4 
所 示 。 称 O(8) 是 的 最 小 上 界 意味 着 是 Og)， 而 且 对 任意 函数 h， 如 果 f 是 O(h)， AB Olg) C Olh). 


O(1) C O(log 1) C O(n2) C O(n) C O(n log n) C O (n2) c O(n*)C***C O(2*) ess 


图 3-4 量 级 层次 中 的 一 些 元 素 ， 符 号 “C ”表示 “包含 于 ”。 
例如 ， 每 个 0(1) 的 函数 也 是 在 O(logn) 中 的 


例如 ， 对 n=0,1,2,...， 如 果 f(n)=n+7， 那么 最 好 的 说 法 是 /是 O(n) 一 一 即使 也是 O(nlogn) 和 
O(n)。 图 3-5 显 示 了 另外 一 些 函 数 范例 以 及 它们 对 应 的 量 级 。 
不 同 量 级 的 函数 结果 是 不 同 的 ， 下 面 给 出 具体 的 例子 。 假 设 n=10;:， 那 么 
| logn = 20 
n= 10° 
nlog,n = 20 x 10$ 
w= 10? 
E logon nz tal R nlog,n 5n AM EE KAP. EEEH, RASH RR i 
半 查 找 树 ， 其 插入 、 删 除 和 查找 方法 的 averageTime(n) 是 O(logn)， 但 这 些 方法 的 worstTime(n) 是 
O(n)。 同 样 ， 在 第 12 章 ， 通 过 对 比 nlogsn 5n, 说 明了 简单 排序 与 快速 排序 的 不 同 ， 前 者 的 
averageTime(n) 为 O(m))， 后 者 的 averageTime(n) 为 O(nlo gn). 
3.4.5 市 表明 ， 在 大 O 表 示 法 的 帮助 下 ， 近 似 worstTime(n) 或 者 averageTime(n) 是 很 容易 的 ， 








f(n) = 3000 
f(n) = [n log5(n + 1) + 2]/(n + 1) 


f(n) = 5 loggn + n 
f(n) = logn” (See Appendix 1) 
f(n) = n(n + 1)/2 


图 3-5 量 级 层次 中 的 一 些 函数 范例 





3.4.5 快速 获取 大 〇 估算 


使 用 大 〇 表示 法 可 快速 粗略 地 估算 worstTime(n) 和 averageTime(n) 的 最 小 上 界 。 

通过 估算 方法 中 的 循环 返 代 次 数 ， 往 往 可 以 马上 得 到 worstTime(m) 在 量 级 层次 中 的 最 小 上 
界 。 令 5 代表 任意 语句 序 烈 ， 它 的 执行 不 包含 循环 语句 ， 循 环 语句 的 迭代 次 数 是 依赖 于 nn 的。 
下 面 的 方法 框架 提供 了 在 量 级 层次 中 求 worstTime(n) 的 最 小 上 界 的 范例 。 

1) worstTime(n) 是 0(1): 

S 

注意 ?的 执行 可 能 是 百 万 条 语句 的 执行 ! 例如 : 

double sum = 0; 

for (int i = 0; i < 10000000; i+ +) 

sum += sqrt (i); 

worstTime(n) 是 O(1) 的 原因 是 因为 循环 迭代 的 数量 是 常数 ， 所 以 不 依赖 于 n。 实 际 上 在 这 
样 的 情况 下 ， 通 常会 绕 过 大 0 表示 法 ， 称 worstTime(n) 是 “常数 ”。 

2) worstTime(n) 是 O(logn): 


while (n > 1) 


{ 
n-n/2; 
S 


) // while 


令 1(n) 是 5 执行 的 次 数 ; 那么 x(n) 等 于 n 可 以 不 断 被 2 除 直 到 n=1 的 次 数 。 根据 附录 1 中 例 A1.3， 
i(n) 是 <1ogzn 的 最 大 的 整数 。 也 就 是 说 ，z(n)=floor(logsn)S 。 所 以 1(n) 是 O(logn)， 因 此 
worstTime(n) 也 是 O(logn)。 

这 种 反复 把 一 个 容器 分 裂 成 两 个 的 现象 将 在 第 4 章 和 第 8~12 章 中 反复 出 现 。 根 据 对 分 裂 的 
MZ: 它 标 志 着 worstTime(n) 是 O(logn)。 


n mM 
IRAK RE E A—-AKFIM ERR, HR LIAÉAXSOESESE 


O(logn), 


当 O(logn) 是 worstTime(n) 的 最 小 LAB, iübonsTinet) Ri “对 数 关 系 ” 


O ”floor(X) 返 回 小 于 等 于 x 的 最 大 整数 。 
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3) worstTime(n) 是 O(n): 
S 
for (i = 0; i <n i++) 


{ 
S 


} // for 
S 


worstTime(n) #2: O(n) HUE ARE Al Du forgé ur T nde. mie ER Korey AR 
执行 了 多 少 条 语句 。 

当 n 是 worstTime(n) 的 最 小 上 界 时 ， 就 说 worstTime(n) 是 和 n 成 “线性 关系 ”的 。 

4) worstTime(n) 是 O(nlogn): 


for (i = 0; i < nN; i++) 


{ 
m n; 
while (m 1) 
{ 
m-m/2, 
S 
) // while 
) // for 


formir nik. Efor, Xdfrfloorogaklywhiled&Se. AL 
worstTime(n)dé O(nlogn). 

5) worstTime(n) Æ O(n’): 
a. for(i-Q;i «n; i++) 

for (j = 0; j < n; j++) 

{ 

S 
) // for j 


SEF HK BE’ 


b tor (i = 0; i< n i++) 
for (j = i; | <n; j++) 


{ 
S 
) // for j 
$ 执 行 的 次 数 是 


n 
nt(n-l)+(n-2)+.…+3+2+1= k 
k=1 


正如 附录 1 中 例 A1l.1 所 示 ， 这 个 累加 之 和 等 于 
n (n+1)/2 
HF O(n’). Bll worstTime(n) O(n’), 
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O AEE 
c. for (i = 0;i <n; i++) 
{ 
， S 
)// fori 
for (i = 0; i < n; i++) 
for (j = 0; j <n; j++) 
í ] 
S 


) // forj 


XHE—EBL, worstTime(n) O(n), 36 BeWworstTime(n) O(n’), Al, PIXAR AER, 
worstTime(m) 就 是 OU 。 通 常情 况 下 ， 对 序列 


A 
B 
gn FAN worstTime(n) ZOU) ia ABA worstTime(n) EO), WASIA, BRIworstTime(n) 
Bre O(f+g) 0 


M n 5 worstTime(n) MR) ELAR, HeULworstTime(n)BAInK “ERER” W. 

我 们 喜欢 尽 可 能 用 简单 的 语言 (“常数 ”,“ 对 数 ”,“ 线 性 ”, “平方 ”) 进行 描述 。 但 是 在 
3.4.6 节 中 将 会 看 到 ， 仍然 有 很 多 场合 ， 所 有 可 以 给 出 的 就 是 一 些 上 界 的 大 O 佑 算 ， 而 不 必 是 
量 级 层次 上 的 最 小 上 界 。 | 

假设 有 一 个 方法 ， 它 的 worstTime(m) 和 成 线性 关系 。 那么 对 某 些 常数 C， 可 以 写成 : 

| worstTime(n) Cn 
问题 的 大 小 加 倍 ， 即 z 加 倍 会 有 什么 影响 呢 ? 
worstTime(2n) = C2n 
=2Cn 
= = 2worstTime(n) 


换 名 话说， "T 那么 最 坏 时 间 花 费 的 估算 也 会 加 倍 。 | 
同 理 ， 如 皮 一 个 方法 的 worstTime(m) 和 nm 成 平方 关系 ， 那 么 对 某 些 常数 C， 可 以 写成 : 
| worstTirhe(n) = = Cn? 
那么 
worstTime(2n) ~ C(2n)’ 
= C4nr’ 
= 4Cn? 
fs 4worstTime(n) 
换 句 话说 ， 如 果 n 加 倍 ， 那么 最 坏 时 间 花 费 的 估算 将 变 成 4 售 。 习题 3 .7、 习 题 12.5 和 实验 
16 以 及 实验 27 探 究 了 这 种 关系 的 一 些 其 他 例子 。 
图 3-6 显 示 了 量 级 层次 中 6 种 量 级 的 相对 增长 速度 。 这 个 图 说 明 了 大 0 的 差别 将 最 终 支 配 国 
数 行为 估算 中 的 其 他 因素 的 原因 。 例 如 ， 即使 当 变 元 小 于 100 000}, T,(n)en'/100LE 
TXn)- 100nlogan 小 ; 但 当 n 足 够 大 时 ， TABLET ARS. | 





BENZ 





worstTime() 
it 3 
oe ) (n2) 
| p" log m) (n) 
O(log a) 
¥i 


3-6 所 种 函数 量 级 的 worstfime( 站 示意 图 


多 项 式 时 间 方 法 是 这 样 一 种 方法 : MEER, ER worstTime(n) ZO). Ain, — 
修 方 落 的 worstTime(p) 是 CO， 这 是 一 个 多 项 式 时 间 方 法 。 问 样 ，wozrstTime( 岂 是 COnlogz 的 
方法 也 是 一 个 多 项 式 时 间 方 法 ， 因 为 O(nlogn)C O02)。 当 试图 开发 一 个 方法 去 解决 给 定 问题 
时 ， 上 应 尽 可 能 地 使 用 多 项 式 时 间 方 法 ; 否则 ， 对 "的 值 很 大 的 情况 ， 方 法 的 运行 是 很 困难 的 。 
如 图 3-6 所 示 的 worstTime(n) 是 0(2”) 的 方法 由 于 该 方法 的 worstTime(m) 增 长 速度 过 快 ， 以 致 于 
当 # 的 值 很 大 堵 这 个 方 共 是 不 可 用 的 。 这 样 的 方法 ， 它 们 不 是 多 项 式 时 间 ， 这 类 方法 统称 为 熙 
时 间 方 法 。 玉 和 手 问题 是 指 任何 可 以 解决 问题 的 方法 都 是 笑 时 间 方 法 的 情况 。 例 如 ， 有 一 个 需 
要 答 出 2 个 数值 的 问题 就 很 辕 和 手 。 在 第 4 章 里 将 看 到 两 个 环 手 问题 的 例子 。 实 验 29 探 讨 了 货 部 
担 问 题 ， 解 决 这 个 问题 的 已 知 的 方 靶 都 是 祺 时 间 方 靶 。 货 郎 担 问题 是 否 环 手 还 是 个 悬而未决 
的 问题 ， 因 为 也 可 能 存在 多 项 式 时 间 方 法 用 以 解决 这 个 问题 。 

如 果 只 使 用 一 个 方法 ， 那么 averageTime( 困 和 worstTime(m) 的 优化 ， 邯 优化 运行 时 间 是 比 
较 容 易 的 。 但 是 管理 整个 项 目 时 ， 通 常 需 要 平衡 考虑 。3.4.6 节 探索 了 其 他 因素 ， 像 空间 利用 
和 项 目 最 终 期 限 之 间 的 协调 。 





在 3.4.5 节 中 ， 看 到 了 如 何 分 析 方 法 的 运行 时 间 需 求 。 同 样 的 大 0 表示 法 还 可 以 估算 方法 的 
空间 需求 。 理 想 状态 下 ， 应 当 能 开发 出 距 快 又 小 的 方法 。 但 是 在 现实 世界 中 这 个 目标 很 难 实 
更 。 更 多 有 时候， 在 编程 中 会 遇 到 下 面 的 问题 

1) 程序 的 运行 时 间 估算 比 性 能 规格 说 明 上 规定 的 可 搂 受 时 间 长 。 性 能 规格 说 明 规 定 了 昌 

-或 部 分 程序 的 时 间 和 空间 上 界 。 
2) 程序 的 空间 需求 估算 比 性 能 规格 说 明 上 规定 的 可 接受 空间 大 。 
3) 程序 可 能 需要 一 种 编程 者 不 太 熟 悉 的 技术 。 这 会 给 整个 项 目 带 来 难以 接受 的 延迟 。 
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通常 需要 做 出 平衡 : 程序 克服 了 某 个 问题 可 能 又 突出 了 另外 两 个 问题 。 现 实 的 编程 总 让 
人 很 难 决 断 。 仅 仅 使 开发 的 程序 能 运行 往往 是 不 够 的 。 适 应 这 类 的 约束 可 以 增强 编程 的 灵活 
性 ， 成 为 一 个 优秀 的 编程 人 员 。 

直到 现在 ， 我 们 还 是 把 正确 性 和 效率 分 开 考 虑 。 根 据 数据 抽象 原理 ， 使 用 类 的 代码 的 正 
确 性 应 该 不 依赖 该 类 的 实现 细节 。 但 是 代码 的 效率 更 依赖 于 这 些 细节 。 换 名 话说， 为 了 效率 ， 
类 的 开发 者 可 以 自由 地 选择 任何 字段 和 方法 定义 ， 提 供 正 确 的 不 依赖 这 些 选择 的 方法 。 例 如 ， 
假设 一 个 类 的 开发 者 创建 类 的 三 个 不 同 版 本 : 

A. 正确 的 ， 效 率 低 的 ， 不 允许 用 户 访问 字段 。 

B. 正确 的 ， 有 点 效率 的 ， 不 允许 用 户 访问 字段 。 

C. 正确 的 ， 高 效率 的 ， 人 允许 用 户 访问 字段 。 

大 多 数 情况 下 ， 比 较 好 的 选择 是 B。 选 择 C 将 违背 数据 抽象 原理 ， 因 为 使 用 C 的 程序 的 正 
确 性 依赖 于 C 的 字段 。 

通过 在 方法 后 置 条 件 中 加 入 性 能 规格 说 明 ， 把 效率 估算 和 方法 正确 性 结合 起 来 。 例 如 ， 
第 12 章 的 通用 型 算法 sort 的 一 部 分 后 置 条 件 是 


worstTime(n) 是 O(n7) 


那么 如 采 方 法 的 定义 正确 ， 它 的 最 坏 时 间 花 费 就 不 会 超过 的 平方 。 回 想 大 0 估算 ， 它 仅 
仪 提供 了 上 界 。 但 是 方法 开发 者 可 以 在 不 违背 合约 的 前 提 下 ， 目 由 地 改进 最 坏 时 间 花 费 的 上 
究 。 例 如 ， 开 发 者 可 能 提供 不 同 定义 的 sort 方 法 ， 它 的 worstTime(n) 是 O(nlogn)。 

下 面 是 方法 后 置 条 件 中 三 条 关于 大 0 估算 的 规格 说 明 的 约定 ， 

1) 变量 n 指 容器 中 项 的 数量 。 7 | 

2) MIRE WH, worstTime(n)#O(1). 如 果 不 给 出 worstTime(n) 的 估算 ， 可 以 假设 
worstTime(n) 是 0(1)。 

3) 通常 情况 下 ，averageTime(n) 和 worstTime(n) 有 相同 的 大 0 估算 。 当 它们 不 同时 ， 将 对 
两 者 都 做 详细 的 说 明 。 | 

这 里 有 必要 强调 的 一 点 是 ， 在 所 有 阶段 做 的 所 有 工作 都 有 一 个 文档 组 件 ， 例 如 ， 问 题 分 
析 阶 段 的 规格 说 明 ， 程 序 设计 阶段 的 方法 接口 和 依赖 关系 图 ， 以 及 程序 实现 阶段 的 大 OO 分析。 
一 般 说 来 ， 每 个 阶段 的 正式 文档 可 用 于 减少 模糊 并 突出 职责 ， 

六 9 分 析 提供 了 估计 方法 效率 的 跨 平台 估算 。3.4.7 节 探讨 了 处 理 效率 的 运行 时 间 工具 ， 


3.4.7 运行 时 间 分 析 


以 流 遂 的 时 间 售 算 运 行 时 间 是 很 不 精确 的 ， 

在 前 面 已 经 看 到 大 O 表 示 法 可 以 不 依赖 任何 具体 的 计算 环境 估算 方法 的 效率 。 在 实践 中 ， 
我 们 也 希望 可 以 估算 某 些 确定 环境 下 的 效率 。 为 什么 要 进行 估算 ? 首先 ， 在 多 道 程序 设计 环 
X, (比如 Windows) 中 ,很 难 判 断 单个 任务 将 执行 多 长 时 间 。 为 什么 ? 因为 有 很 多 东西 是 在 
台 运行 的 ， 像 维护 桌面 时 钟 ， 循 环 等 待 直到 单 击 鼠标 ， 更 新 来 自 邮 箱 和 浏览 器 的 信息 ， 在 
任何 给 定时 刻 ， 都 会 有 很 多 这 样 的 进程 被 Windows 管 理 器 控制 运行 。 并 且 每 个 进程 将 获得 
个 几 毫 秒 的 时 间 片 。 一 个 任务 执行 后 流逝 的 时 间 很 少 会 是 对 任务 工作 时 间 的 精确 的 测量 . 

。 寻求 效率 的 精确 测量 的 另 一 个 问题 是 它 可 能 耗费 很 长 的 时 间 : O( 永 远 )。 例 如 ， 假 设 比较 
两 个 排序 方法 ， 我 们 希望 能 确定 每 个 方法 排序 一 些 容器 所 花费 的 平均 时 间 。 这 个 时 间 将 很 大 
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程度 上 依赖 于 所 选项 的 具体 顺序 。 因 为 a 项 共有 nn! 种 不 同 的 顺序 ， 生 成 所 有 可 能 的 顺序 ， 并 对 
每 个 顺序 运行 方法 并 计算 平均 时 间 ， 这 是 不 可 能 的 。 

取而代之 的 是 ， 可 以 生成 一 个 样本 顺序 ， 它 是 “没有 特别 顺序 ”的 。“ 没 有 特别 顺序 ”所 
对 应 的 统计 学 概念 是 随机 。 可 以 使 用 排序 随机 样本 的 时 间 估 算 平均 排序 时 间 。 

C++ 提 供 了 time 和 rand 函 数 来 帮助 用 户 解 决 计 时 间 题 。 

time RAW: C+t+ 的 time 函 数 采用 一 个 指向 Struct 对 象 的 指针 保存 当前 时 间 的 信息 ( 像 小 时 、 
天 和 年 )。 当 使 用 一 个 NULL 变 元 进行 调用 时 ， 返 回 值 是 long 类 型 的 ， 代 表 自 1970 年 1 月 1 日 0 
点 起 所 经 过 的 时 间 (国际 标准 时 间 ， 以 秒 为 单位 )。 

为 了 求 出 一 个 任务 耗费 的 时 间 、 可 以 计算 任务 代码 运行 之 前 和 刚 运行 结束 之 后 的 时 间 ， 
然后 用 “之 后 的 ”时 间 减 去 “之 前 的 ”时 间 。 例 如 ， 进 行 运行 时 间 神 试 的 程序 通常 应 包括 下 

[33] 面 的 部 分 : 
1/ 判断 一 个 任务 耗费 的 时 间 。 
#include <iostream> 


#include <string> 
#include <time.h> // Fs BHtime & #& 


int main ( ) 
{ 
const string TIME MESSAGE 1 = "The elapsed time was "; 
const string TIME MESSAGE 2 = " seconds."; 
const string CLOSE WINDOW . PROMPT = 
"Please press the Enter key to close this output window:"; 


long start time, 
finish time, 
elapsed time; 


start time = time (NULL); 
II 运行 任务 : Do. 


/ 计算 任务 执行 后 流逝 的 时 间 : 
finish_time = time (NULL); 
elapsed_time = finish_time — start_time; 
cout << TIME_MESSAGE_1 << elapsed_time << 
TIME. MESSAGE 2 
<< endl; 


cout << endl << endl << CLOSE WINDOW PROMPT; 
cin.get( ); | 
return 0; 

) // main 


以 整个 时 间 测 量 运行 时 间 妨 碍 了 精确 性 。 但 是 正如 曾 提 到 过 的 ， 在 多 道 程序 环境 下 很 难 


孤立 一 个 任务 的 运行 时 间 。 来 自 其 他 因素 的 影响 ， 像 高 速 缓冲 存储 器 的 利用 和 早先 程序 运行 
中 存在 的 磁盘 缓冲 区 ， 都 会 导致 即便 是 同一 任务 连续 运行 的 运行 时 间 上 的 极 大 不 同 。 因 此 应 
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该 把 一 个 任务 共用 的 时 间 ( 即 执行 任务 后 流逝 的 时 间 ) 看 作 是 实际 运行 时 间 的 估算 一 一 它 其 


至 比 大 0 分 析 还 粗糙 。 
计时 是 实验 9 的 主题 。 这 个 实验 还 增加 了 3.4.8 节 介绍 的 随机 性 的 素材 。 


3.4.8 随机 性 


给 出 一 系列 数值 ， 从 这 些 数 值 中 随机 地 选择 一 个 数值 ， 也 就 是 每 个 数值 都 有 相同 的 被 选 
中 的 几率 。 这 样 选择 的 数值 称 作 随机 数 ， 而 返回 随机 数 的 函数 称 作 随 机 数 生成 器 。C++ 有 一 
个 系统 函数 rand， 它 提供 了 一 个 随机 数 生成 器 。 严 格 说 来 ，rand 函 数 是 一 个 伪 随 机 数 生 成 器 ， 
因为 这 些 数 值 是 计算 出 的 而 不 是 真正 随机 的 一 一 它们 是 由 函数 求 出 的 。 不 考虑 如 何 计算 时 ， 
这 些 数值 看 起 来 是 随机 的 。 在 系统 头 文件 stdlib.h 里 声明 了 rand 函 数 。 


rand 遇 数 没 有 参数 ， 并 返回 一 个 0 到 RAND_MAX 之 间 的 伪 随 机 数 (stdlib.h 中 定义 常量 标 


识 符 RAND_MAX 为 0x7ff， 这 是 十 六 进 制 形式 ， 表 示 32 767). 

rand 困 数 计算 的 数值 依赖 于 给 定 的 种 子 。 种 子 是 一 个 预 声 明 的 unsigned int (无 符号 整 
型 )， 它 的 初始 值 是 用 srand 函 数 设置 的 。srand 函 数 接收 一 个 unsigned int 类 型 的 变 元 并 将 种 
子 设置 成 这 个 数 。 在 任何 srand 调 用 前 调用 rand 生 成 的 序列 是 和 用 1 作为 种 子 传递 调用 srand 生 
成 的 序列 相同 。 每 次 调用 rand 函 数 时 ， 就 用 种 子 的 当前 值 求 种 子 的 下 一 个 值 。 种 子 的 这 个 新 
值 确定 了 rand 的 返回 值 。 

例如 ,假设 两 个 程序 有 : 

#include <stdlib. h> // 声明 srand 和 rand 范 数 

srand (100); 

for (int i = 0; i < 5; i++) 

cout << rand ( ) << endl; 

这 两 个 程序 的 输出 恰好 是 相同 的 e: 

1862 

11548 

3973 

4846 

9095 


当 想 要 比较 程序 行为 时 ， 比如 在 后 面 的 实验 以 及 第 4~14 章 中 ， 这 个 重复 性 是 很 有 帮助 的 ， 
一 般 来 说 ， 重 复 性 是 科学 方法 的 一 个 基本 特点 。 

如 果 不 想 重复 ， 开始 时 就 使 用 time(NULL) 作 为 变 元 调用 函数 srand. 这 暗示 着 除非 在 同一 
秒 内 运行 两 遍 程 序 (这 基本 是 不 可 能 的 )， 含 则 是 绝 不 可 能 得 到 相同 的 伪 随 机 数 序列 的 。 

例如 ， 编 写 代码 : 

#include <stdlib.h> // 声明 srand 和 rand 函 数 

srand (time (NULL)); 


for (int i = 0; i < 5; i++) 
|. cout << rand ( ) << end; 


”每 次 运行 程序 时 ， 都 会 得 到 0 和 RAND_MAX 之 间 的 不 同 的 5 个 随机 整数 ， 
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实验 9 着 重 讲述 了 国 数 time 和 rand， 以 及 它们 在 计时 实验 中 的 使 用 。 
实验 9: 计时 和 随机 性 (所 有 实验 都 是 可 选 的 ) 
在 程序 实现 介绍 中 最 后 描述 一 下 类 型 转换 。 类 型 转换 的 基本 思想 是 改变 表达 式 的 求 值 ， 
将 表达 式 的 类 型 临时 解释 成 一 个 不 同 的 类 型 。 
3.4.9 类 型 转换 


为 了 显 式 地 改变 一 个 表达 式 的 类 型 ，C++ 提 供 了 类 型 转换 。 类 型 转换 的 组 成 是 一 对 圆 括号 
及 其 中 的 一 个 类 型 ， 后 面 跟着 将 被 转换 的 表达 式 。 例如， 可 以 把 一 个 表达 式 按 如 下 方式 从 


long 转 换 成 float: 
long i = 3, 
j = 5; 


cout << i /j << endi; // 输出 将 是 0 

cout << (float) i/ j << endl; / 输出 将 是 .6 

类 型 转换 运算 符 一 一 圆 括号 一 一 比 除法 运算 符 的 优先 级 高 ， 因 此 在 除 以 j 之 前 i 就 被 转换 成 
浮 扩 型 了 。 另 一 种 表示 法 是 将 要 类 型 转换 的 表达 式 放 进 圆 括号 : 

cout««float(i)/j««endl; 

由 多 个 标识 符 组 成 的 类 型 必须 用 圆 括号 括 起 来 ， 由 多 个 标识 符 或 文字 符号 组 成 的 表达 式 
也 必须 用 圆 括号 插 起 来 。 有 时 候 类 型 和 表达 式 都 需要 括号 。 例 如 ， 可 能 有 : 

(Node*)(head->next) 

通常 ， 使 用 类 型 转换 时 ， 表达 式 的 数值 的 大 小 和 类 型 的 大 小 所 占据 的 字 节 是 相同 的 。 这 
是 因为 通常 类 型 转换 并 不 修改 值 的 实际 位 数 ， 而 只 是 解释 这 些 位 。 但 是 对 于 数值 ，C++ 定 义 
了 不 同 数值 类 型 的 转换 ， 因 此 即使 它们 大 小 不 同 也 可 以 进行 转换 。 例 如 ， 可 以 将 short 转 换 成 
float。 在 另 一 个 例子 中 ， 我 们 将 int 转 换 成 char: 

int i=65; 

cout««(char)i««endil; 
这 些 将 输出 语句 中 的 类 型 转换 成 char， 因 此 输出 是 

A | 

因为 ASCII 排 序 序列 中 第 65 个 字符 就 是 “A’。 

也 可 以 将 char 转 换 成 int。 例 如 ， 假 设 有 : 

char new_char='D': 

cout««(int)new char; 

答 出 是 68， 因 为 “D ”是 ASCH 排 序 序列 中 第 68 个 字符 。 

所 有 的 指针 都 是 相同 类 型 的 ， 一 般 是 4 个 字 节 ， 因此 它们 之 间 的 转换 是 合法 的 。 在 第 4 章 
探索 void 指 针 的 奥秘 时 ， 应 用 这 一 点 会 有 很 好 的 效果 。 但 转换 一 定 要 谨慎 ! 如 果 将 某 个 确定 
大 小 的 表达 式 转换 成 小 一 些 的 表达 式 ， 就 会 丢失 一 些 重 要 的 信息 。 例如 ， 如 果 将 long 转 换 成 








int， 或 将 double 转 换 成 float ， 就 会 丢失 精度 。 
程序 开发 生命 周期 的 最 后 阶段 是 程序 的 维护 。 


3.5 程序 维护 


程序 实现 阶段 结束 之 后 ， 该 程序 就 可 以 给 终端 用 户 了 。 某 些 程序 ， 称 作成 品 程序 ， 以 几 
年 作为 运行 周期 。 随 着 时 间 的 流逝 ， 每 个 程序 几乎 都 不 可 训 免 地 经 历 一 些 改变 。 程 序 维护 指 
的 是 对 已 经 部 署 的 程序 进行 修改 。 这 个 维护 工作 可 以 由 原先 开发 程序 的 分 析 人 员 、 设 计 人 员 
和 编程 人 员 完 成 ， 但 更 多 的 时 候 是 由 有 新 观点 的 新 团队 来 完成 。 

软件 维护 和 硬件 维护 有 根本 的 不 同 ， 因 为 代码 是 不 会 变 坏 的 。 磁 盘 驱 动 器 有 一 个 平均 失 
败 时 间 ， 但 是 在 延期 使 用 之 后 switch 语 句 也 不 会 开始 丢失 case。 那 么 软件 维护 需要 做 什么 ? 
维护 团队 有 责任 更 正 发 现 的 错误 ， 并 避免 在 创建 程序 中 出 现 错误 造成 将 来 的 失败 。 不 过 大 部 
分 维护 团队 所 做 的 工作 都 是 去 增强 原 系统 。 

增强 一 个 已 有 的 程序 是 一 项 具有 挑战 性 的 任务 。 如 果 用 可 维护 性 的 观点 开发 源 项 目 ， 像 
进行 全 面 系统 测试 ， 对 类 高 度 模 块 化 ， 那 么 维护 就 容易 得 多 了 。 

例如 ， 考 虑 计 税 软件 。 税 表 是 每 年 都 会 改变 的 ， 因 此 它们 应 该 是 一 个 单独 的 类 。 同 样 ， 

可 能 会 扩充 纳税 人 的 身份 识别 以 允许 数字 签名 ， 另 外 还 有 常用 的 数据 : 姓名 ， 地 址 ， 社 会 保 
障 号 码 等 等 。 那 么 必须 扩展 包含 这 些 字段 的 类 ， 以 增加 额外 的 功能 。 因 为 纳税 代码 逐年 越 恋 
越 复杂 (可 能 只 是 看 上 去 如 此 )， 所 以 对 模块 化 的 要 求 也 在 相应 增强 。 

程序 维护 决 不 是 一 个 次 要 的 工作 。 在 某 些 公司 中 ， 编 程 者 平均 有 超过 50% 的 时 间 用 于 程 
序 维护 。 这 强调 了 软件 开发 生命 周期 的 所 有 阶段 中 对 文档 的 需要 。 没 有 文档 ， 即 使 是 维护 自 
己 的 程序 也 是 非常 耗费 时 间 且 困难 重重 的 。 


总 结 


本 章 介绍 了 软件 工程 的 基本 概念 ， 它 是 原理 、 技 术 和 工具 在 软件 生产 上 的 应 用 。 程 序 汪 
产 “ 年 表 ” 一 一 软件 开发 生命 周期 一 -由 四 个 阶段 组 成 。 每 个 阶段 都 有 一 个 文档 部 分 ， 而 且 整 
个 过 程 通常 是 迭代 而 不 是 线性 的 。 … s 

在 问题 分 析 阶 段 ， 开发 详细 的 规格 说 明和 系统 测试 。 ! 

在 程序 设计 阶段 ， 按 照 需要 设计 新 的 类 。 为 每 个 这 样 的 类 确定 方法 接口 和 字段 。 依 赖 关 
系 图 阐述 了 类 之 间 的 继承 关系 以 及 调用 对 象 的 对 象 字段 的 依赖 性 或 独立 性 ， 

在 程序 实现 阶段 ， 为 程序 设计 阶段 引入 的 类 定义 方法 。 大 O 表 示 法 可 以 快速 地 估算 方法 的 
时 间 - 空 间 效率 。 项 目 验证 是 自 底 向 上 进行 的 。 用 一 个 驱动 器 测试 低层 次 的 类 ， 然 后 使 用 这 些 
类 测试 高 层次 的 类 。 最 后 使 用 问题 分 析 阶段 开发 的 系统 测试 以 及 其 他 的 测试 来 验证 项 目 。 运 
行 时 间 分 析 经 常 使 用 time 和 random 函 数 。 | 

程序 验证 完毕 之 后 ， SLE REA Bi TEREE. 


习题 
3.1 创建 一 个 方法 ， 


void sample(int n); 


[87 | 
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使 得 它 的 worstTime(n) 是 O(n)， 但 worstTime(n) 不 和 成 线性 关系 。 
提示 O00) 提供 了 一 个 上 界 ， 但 是 “和 nn 成 线性 关系 ” 指 的 是 最 小 上 春 。 


3.2 研究 下 面 的 代码 : 
// 令 是 满足 afi]=item 的 0...n-1 之 间 的 最 小 的 下 标 。 
i-0; 
while(a[il!zitem) 
i++; 


假设 a 是 n 元 素数 组 并 且 在 0...n- 1 之 间 至 少 有 一 个 下 标 k， 满 足 alk]=item。 和 寻找 一 

个 函数 g 使 得 worstTime(n) 是 O(g)， 而 且 O(g) 是 worstTime(n) 的 最 小 上 界 。 
3.3 研究 下 面 的 关于 字符 串 数组 a 的 代码 : 

1/ {按照 增 序 ) HEPFa[O...n-1]: 
for (i = 0; i < n—1; i++) 
{ 

// BEFea[O...i]3f S a[O...i]«-af[i--1...n-1]: 

position — i; 

for (j = i+1; j < n; j++) 

if (a [j] < a [position]) 
position = j; 

string temp = a fi]; 

a [i] = a [position]: 

a [position] = temp; 


) / 外 部 for 


a. 当 访 0 时 ， 内 部 for 循 环 进行 呈 1 次 迭代 。 当 i=1 时 进行 多 少 次 迭代 ? 当 志 2 时 呢 ? 
b. 求 一 个 z 的 图 数 ， 当 ;到 0 到 2 之 间 的 值 时 内 部 for 循 环 的 总 迭代 次 数 。 
c. 找到 一 个 函数 g， 使 得 外 部 for 语 名 的 worstTime(m) 是 O(g)， 并 且 O(8) 是 worstTime(n) 
的 最 小 上 界 。 
34 对 下 面 的 每 个 函数 f/， 当 n=0,1,2,3,… 时 ， 寻 找 函 数 g 使 得 O(8) 是 /的 最 小 上 界 : 


a. f(n) = (2 + n) (3 + log, n) 

b. f(n) = 11 log,n ^ n/2 — 3452 

c. fl(m)=1+2+3+...+n 

d. f(mn-on(3-*n)- 7n 

e. f(n)- 7n + (n — 1) log, (n — 4) 

f. fn) = log.(n?) +n . 

z. fin) - + 1) log,(n + 1) Z4 +1)+] 


on 
h. f(n) =n + n/2 + ni4 + n/8 + n6 +... 


3.5 在 量 级 层次 中 ， 有 ...，O(logn) Com, ..., iEBR: 对 任意 整数 n>16，logn<n'?。 


从 微 积分 得 到 的 提示 。 ” 证 明 对 所 有 的 实数 x*>16， 函 数 logx* 的 斜率 小 于 函数 +"? 的 
斜率 。 由 log.(16)=16%， 推 断 对 所 有 实数 x>16，logx<x1?。 








I 个 


3.6 对 下 列 代 码 段 ， 寻 找 一 个 商 数 g， 使 得 O(8) 是 worstTime(n) 的 最 小 上 界 。 在 每 段 程序 里 ， 
S$ 代表 了 一 些 不 依赖 于 n 的 循环 语句 。 
a. for{(i= 0;i*i<n;i++t) 

S 
b. for(i = 0; sqrt (i) < n; i++) 
S 
c. kK=1; 
for (i = 0;i «n; i++) 
k *= 2; 
for (i = 0; i < k; i++) 
S 


提示 在 每 种 情况 里 ，2 都 是 答案 的 一 部 分 


3.7 a. 假设 有 一 个 方法 ， 它 的 worstTime(n) 和 n 成 线性 关系 。 计 算 当 n 变 成 三 倍 时 对 最 坏 时 
间 花 费 估算 的 影响 。 也 就 是 说 ， 根 据 worstTime(m) 估 算 worstTime(3n)。 
b. 假设 有 一 个 方法 ， 它 的 worstTime(n) 和 n 成 平方 关系 。 计 算 当 n 变 成 三 倍 时 对 最 坏 时 
间 花 费 估算 的 影响 。 也 就 是 说 ， 根 据 worstTime(n) 估 算 worstTime(3n)。 
c. 假 设 有 一 个 方法 ， 它 的 worstTime(n) 是 常数 。 计 算 当 n 变 成 三 二 倍 时 对 最 坏 时 间 花 费 估 
算 的 影响 。 也 就 是 说 ， 根 据 worstTime(n) 估 算 worstTime(3n)。 
3.8 针对 下 述 问题 开发 功能 规格 说 明 : 给 出 一 系列 测验 成 绩 ， 求 出 平均 成 绩 之 下 的 成 绩 的 
数量 。 | 
3.9 为 习题 3.8 描 述 的 问题 创建 系统 测试 。 
3.10 用 一 个 Linked 对 象 ， 设 计 并 实现 程序 解决 习题 3.8 和 习题 3.9 描 述 的 问题 。 
3.11 证 明 On) = O(n+7)。 


提示 ”使 用 大 0 的 定义 。 


3.12 下 面 的 哪个 表达 式 包 含 一 个 在 1 和 6 之 间 (包括 1 和 6) 的 随机 整数 ? 
a. rand()966 
b. rand()9654.1 
c. rand()%7 
d. rand()%6+1 


编程 项 目 3.1: Linked 类 的 进一步 扩充 


1) 扩充 实验 8 的 Linked 类 ， 添 加 一 个 pop_back 方 法 。 下 面 是 方法 接口 ， 


// 前 置 条 件 : 这 个 Linked 对 象 非 空 , 

(ERR: 调用 前 在 这 个 Linked 对 象 后 面 的 项 已 被 晋 除 。worstTime(n) 是 OUn). 
void pop_back(); 

2) 扩展 实验 8 的 LinkedDriver 类 以 验证 pop_back 方 法 。 

3) 假设 从 一 个 空 的 int 类 型 的 Linked 容 器 开始 : 
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Linked «int» intList; 
LESE va Hinikpush. fronts Z Ja 4 A nt pop_fronts 3 R AIK IH] AA FH ni push. backs z Ji Hi 
调用 nn 次 pop_backs 需 要 的 时 间 。 选 择 足够 大 的 n， 使 得 差别 至 少 是 2 秒 。 这 些 时 间 和 你 的 大 O 分 
析 一 致 吗 ? 





第 4 章 o B 


初学 者 和 有 经 验 的 编程 人 员 之 间 的 重要 区 别 就 在 于 对 递归 的 理解 。 本 章 的 目的 是 引导 读 
者 了 解 递归 函数 适用 的 场合 ， 然 后 就 可 以 看 到 递归 的 精巧 以 及 它 的 强大 功能 ， 当 然 还 有 使 用 
不 当时 的 裤 在 危险 。 

标准 模板 库 中 的 大 部 分 常用 实现 都 使 用 了 递归 : tree (H-A) 类 中 的 copy 函 数 和 sort 算 
法 。 但 是 递归 的 价值 远 远 不 止 这 两 个 实例 。 例 如 ， 第 7 章 中 的 stack 类 的 一 个 应 用 ， 就 是 递归 国 
数 翻译 成 机 器 代码 。 以 及 在 第 8 章 中 ， 大 部 分 与 二 叉 树 相关 的 定义 都 是 或 者 可 以 是 递归 的 。 越 
早 接 触 递归 ， 就 越 有 可 能 掌握 它 所 适用 的 环境 并 使 用 它 | 


目标 


D) 总 结 适合 用 递归 解决 的 问题 的 特点 。 
2) 比较 递归 和 氨 代 函数 的 时 间 空 间 人 代价， 以 及 它们 的 开发 难 易 程度 ， 
3) 通过 执行 结构 框架 跟踪 一 个 递归 函数 的 执行 。 

. 4) 掌握 求解 问题 时 使 用 的 回溯 策略 。 


4.1 简介 


简单 地 说 ， 当 一 个 函数 包含 着 对 它 自身 的 调用 时 就 称 这 个 函数 是 递归 的 9S。 这 个 描述 令 人 
产生 一 个 可 怕 的 想法 ， 就 是 递归 函数 的 执行 将 导致 无 穷 多 的 递归 调用 。 但 是 在 正常 情况 下 ， 
这 是 不 会 发 生 的， 调用 最 终 可 以 停止 。 为 了 说 明 递 妇 是 如 何 实现 的 ， 以 下 给 出 了 一 个 上 典型 的 
x$ HER T : 

if (最 简单 的 情况 ) 


直接 处 理 
else 


递归 调用 一 个 较 简单 的 情况 
这 部 分 说 明 ， 适 合 采 用 递归 处 理 的 问题 具有 以 下 两 个 特点 : 
D 问题 的 复杂 情况 可 以 简化 成 和 它 形式 相同 的 较 简 单 的 情况 ， 
2) 最 简单 的 情况 可 以 直接 处 理 。 | 


综 上 所 述 ， 如 果 读 者 熟悉 数学 归纳 法 (参见 附录 1)， 就 会 发 现 这 两 个 特点 怡 好 对 应 着 妇 
纳 部 分 和 基础 部 分 。 “… 


随 着 示例 的 深入 ， 不 要 被 旧 的 编程 思想 禁 铀 。 尽 可 能 地 尝试 将 每 一 个 问题 都 转化 成 形式 
相同 但 较为 简单 的 问题 ， 递 归 地 去 考虑 。 


4.2 阶乘 
给 定 一 个 正 整数 "，z 的 阶乘 记 作 xz!， 它 是 所 有 1 和 mn (包括 1 和 n) 之 间 的 整数 的 乘积 。 例 如 ， 
O 递归 的 正式 定义 参见 4.8 节 。 
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£4¢ 
4| 24x 3x2x 1224 
和 
61 =6x5x4x3x2-x 1=720 
另 一 种 计算 阶乘 的 方法 如 下 : 
4| =4 x 3! 
这 个 公式 没什么 用 处 ， 除 非 能 知道 31 是 什么 。 但 是 可 以 根据 小 一 点 的 数 的 阶乘 来 继续 计 
TET SE: 
3! =3 x 2! 
21 =2 x I! 


注意 1! 可 以 直接 计算 出 来 : 它 的 值 是 1。 现 在 再 回 过 头 来 计算 4! : 
2| =2 x 1! 22x 1=2 
3| =3 x2! =3 x 2=6 
4| =4x3! =4 x 6-24 
对 n>1， 我 们 将 计算 n! 的 问题 简化 成 计算 (4-1)!。 当 到 达 1! (也 就 是 1) 时 停止 简化 。 以 
上 的 这 些 观 察 产 生 了 下 面 的 函数 ; 为 了 能 正常 地 结束 9S， 将 0! 定义 成 1。 
/| 前 置 条 件 : n>=0。 
/ 后 置 条 件 : 返回 的 数值 是 n!， 也 就 是 1 和 n (包括 1 和 n) 之 间 所 有 整数 的 乘积 。 


// worstTime(n)#O(n). 
long factorial (int n) 
{ 


if (n == 0 || n == 1) 
return 1; 
else 


return n * factorial (n — 1); 
) // factorial 


在 factorial 中 ， 有 一 个 对 factorial 的 调用 ， 因 此 它 是 递归 的 。 在 本 书 网 站 提供 的 源 代码 中 
有 这 个 函数 的 驱动 程序 。 


下 面 的 图 表 显 示 了 当初 始 变 元 值 为 4 时 ，factorial 的 跟踪 执行 情况 : 


n factorial(n) 的 公式 | factorial(n) 的 值 
4 4 * factorial(3) | | 4 * 6 = 24 

3 | | MM | 3*2 I 

2 MN ) 2* | 1 

| r_,! 


O ”从 n 项 中 抽取 k 项 的 组 合 数 是 nk! (n-k)! n- Kb, 得 到 nin! - 00， 因为 0!=1， 所 以 这 个 组 合 值 是 1 。 
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函数 的 每 次 递归 调用 ， 形 参 n 的 值 都 会 随 之 减 1。 但 是 在 n=1 即 最 后 一 个 调用 之 后 ， 就 需要 
和 前 面 的 n 的 值 相 乘 。 例 如 ， 当 n=4 时 ，n"*factorial(n-J1) 的 计算 必须 延迟 到 对 factorialn- 1) 的 
调用 结束 之 后 。 当 最 终 值 6 (也 就 是 factorial(3)) 被 返回 时 ，n 的 值 4 就 可 用 了 。 

这 样 ， 在 调用 factorial(n- J) 时 必须 保存 n 的 数值 。 而 当 factorialn- 1) 调 用 结束 之 后 又 必须 
恢复 这 个 值 来 计算 n* factorial(n- 1). 递归 的 好 处 就 在 于 编程 者 不 需要 明确 地 处 理 这 些 存储 和 
恢复 ; 计算 机 会 做 这 个 工作 。 

factorial AAA AY ARE: n 是 一 个 非 负 整 数 。 如 果 一 个 用 户 调用 factorial(--1) 将 产生 什 
LERE? 因为 n 既 不 是 0 也 不 是 1， 所 以 执行 else 部 分 ， 它 包含 了 对 factorial(-2) 的 调用 。 在 
这 个 调用 中 ，n 仍 然 是 既 不 为 0 也 不 为 1， 因 此 继续 调用 factorial(-3)， 然 后 是 factorial(-4)， 
factorial(-5), $Ẹ. ain. 所 有 这 些 被 存储 的 n 的 拷贝 将 使 得 堆栈 ( 即 一 块 内 存 区 域 ) iwi. 
这 个 现象 称 作 无 穷 递 归 。 

如 前 置 条 件 所 述 ， 在 上 面 的 factorial 函 数 里 ， 如 果 变 量 值 大 于 等 于 1 就 可 以 避免 无 穷 递归 。 
通常 情况 下 ， 如 果 每 个 递归 调用 都 可 以 向 “最 简单 的 情况 ”推进 ， 那 么 就 可 以 避免 无 穷 递 归 。 
注意 如 果 将 

(n= =Olln= =1) 

替换 成 

(n<=1) 


MARAMA —7> Si Beta ARS HH LCS BB. ISSR. AGMA EF Pole icr 
危险 ， 因 为 即使 变 元 违背 前 置 条 件 也 无 法 察觉 。 通常 来 说 ， 得 到 一 个 错误 的 答案 还 不 如 没有 
au. 


执行 结构 框架 


执行 结构 框架 显示 了 当 递 归 方 法 执行 时 的 情况 。 

可 以 通过 执行 结构 框架 跟踪 一 个 递归 函数 : Fi ARETR a AER 每 
个 执行 结构 框架 中 都 有 参数 和 其 他 局 部 变量 的 值 。 每 个 框 中 还 有 递归 函数 代码 的 相应 部 
分 一 一 特别 是 递归 调用 以 及 变 元 的 值 。 当 进行 一 个 递归 调用 时 ， 在 当前 执行 结构 框架 的 上 面 
就 会 构造 一 个 新 的 执行 结构 框架 : 调用 结束 之 后 这 个 新 的 框 也 随 之 消失 。 一 个 检查 标志 “vv” 
Tos T ARAE DAAT AO IE ET EBORE T E (也 就 是 创建 当前 窒 的 执行 结构 框架 ) 
中 执行 。 | 

例如 ， LL FARE FEE factorial RAZ octo NERA FTH OR 
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n-2 _ gg Roe 
w return 2 * factorial (1); 






























| n= 3. | ron | : 
: / return 3 * factorial (2); | 
‘ f TAR T EA EITE 
t 
=2 
w return 2 * factorial (1); 
OG HOO: 3 GRE RAEN ici SR 
return 
RPS SAWS Seg 
return 4 * factorial (3); 
SHORTS 5 eee Roc oe a eA; 
5 
ud R 
Nu S 3 
CR | \ 
e ! 
ein. tance DLE 时 间 取 决 于 递归 调用 的 次 数 。 对 任何 
n ; 次 递归 调用 ， Zr4mYeSIDB E h ee 2 ! = 
worstTime(n) 5j; | T | | 
‘ b 3 * B , 
: 6 SNR RR : 
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递归 函数 通常 都 需要 一 些 额外 的 存储 代价 。 例 如 ， 每 次 进行 一 个 factorial 递 归 调 用 时 ， 都 
需要 保存 返回 地 址 和 变 元 的 拷贝 。 因 此 ，worstSpace() 也 和 nt 成 线性 关系 。 

递归 可 以 使 问题 的 解决 更 加 容易 。 但 是 任何 可 以 用 递归 来 处 理 的 问题 也 同样 可 以 用 先 代 
处 理 。 和 迭代 半数 使 用 循环 语句 取代 了 递归 。 例 如 ， 以 下 使 用 了 一 个 迭代 尔 数 计算 阶乘 : 
| 1 前 置 条 件 : n>=0 | 
/ 后 置 条 件 : 返回 的 数值 是 n!， 也 就 是 1 和 n 之 间 (包括 1 和 n) 所 有 整数 的 乘积 。 
// worstTime(n)4@ O(n), 


long factorial (int n) 


{ 


int product = n; 


if (n == 0) 
return 1: 
for (int i = n ~ 1;1 > 1; i--) 
product = product * i; 
return product; 
Vi tactorial z # 


FLIX TK KRM factorialik A, worstTime(n) Fink RERA, icf EER. BER 
论 z 取 值 如 何 ， 和 迭代 国 数 的 跟踪 始终 只 需要 使 用 三 个 变量 ， 因 此 没有 太 大 的 存储 需要 ， 这 和 递 
归 不 同 。 读 者 可 能 马上 想到 迭代 是 根据 递归 的 定义 进行 的 ， 从 这 个 意义 上 讲 欠 代 比 递 归 要 好 。 
这 是 个 不 错 的 观点 。 最 后 ， 这 两 个 消 数 都 是 相当 容易 理解 的 。 迭 代 多 两 个 变量 ,但 是 递归 也 
数 展示 了 一 个 新 的 解决 问题 的 技术 ， 当 然 它 需 要 一 些 额外 的 开销 。 
综 上 所 述 ， 在 这 个 例子 里 ，factorial 函 数 的 迭代 版 本 比 递归 版 本 要 好 -- 些 。 这 里 的 目的 是 
说 明了 在 一 个 简单 的 情况 下 ， 递 归 是 值得 考虑 的 ， 尽 管 最 终 仍然 是 迭代 更 好 。 但 下 面 4.3 节 给 
出 的 例子 中 ， 友 代 版 本 就 不 那么 吸引 人 了 。 


4.3 十 进 制 到 二 进 制 的 转换 


入 们 习惯 以 10 作 为 基数 计算 ， 可 能 是 因为 我 们 生来 都 有 10 个 手指 。 计 算 机 自然 以 2 作为 基 
数 计 算 ， 这 是 因为 电子 元 件 的 二 态 性 。 计 算 机 需要 执行 的 一 个 任务 是 将 十 进 制 (以 10 为 基数 ) 
转化 成 二 进 制 ( 以 2 为 基数 )。 这 在 来 开发 一 个 简单 的 函数 来 解决 这 个 问题 

给 定 一 个 非 负 整数 x*， 输 出 和 它 相等 的 二 进 制 数 。 

例如 ， 如 果 n 是 25， 那 么 和 它 相 等 的 二 进 制 数 就 是 11001。 有 好 几 种 方法 可 以 解决 这 个 问 
题 ， 其 中 之 一 是 基于 以 下 观察 : 

最 右边 的 位 是 na%2;， 其 他 位 和 /2 的 二 进 制 等 值 数 相间 。 

例如 ， 如 果 n 是 25， 那 么 25 的 二 进 制 等 值 数 的 最 右边 位 是 25%2， 即 1; 剩余 的 位 是 25/2 也 
就 是 12 的 二 进 制 等 值 数 。 因 此 可 以 得 到 所 有 的 位 如 下 : 





2562 - 1 2 = 12| | 


E 12562 = 0; 12/2 =6 


6 % die 0; 6/2 — 3 
Vitae ts i aint e. 





自 底 向 上 可 以 写 出 剩 下 的 位 ， 这 样 最 右边 的 位 就 写 在 最 后 。 于 是 输出 就 是 
11001 


计算 二 进 制 等 值 数 的 函数 称 作 writeBinary。 下 面 的 图 表 阐 述 了 调用 writeBinary(25) 的 执行 
过 程 : 


v2 n%2 Output 





这 些 探讨 说 明 在 任何 输出 之 前 必须 执行 全 部 的 计算 。 从 递归 来 说 ,就 是 在 输出 n%2 之 前 
需要 写 出 n/2 的 二 进 制 等 值 数 。 换 旬 话 说 ， a AR ERN 
FA. 4/2720, Rn TI ep 

KAT: 


/ 前 置 条 件 : n>=0 

// 后 置 条 件 : 输出 n 的 二 进 制 等 值 数 。 worstTime(n) 

// | 是 O(log n). 

void writeBinary (int n) ` 

{ 
if (n == 0||n == 1) 

cout << n; 

else — i 

{ 
writeBinary (n / 2); 
cout << n 96 2; 

) // else 








T 


) // writeBinary 
下 面 是 初始 调用 writeBinary(12) 之 后 writeBinary 函 数 的 单 步 跟踪 执行 结构 框架 


n — 12 
4 writeBinary (6); 


Vl fisara (1); 
scout << 1; 





77 





78 RAG 


EEE RS PVR ey 
n=6 
writeBinary (3); 
|v cout << 0; 


w writeBinary (6); 
cout «« 0 ; 


qNIMCCOES CC Ope Nom a A 
FCU d m JUIN IER rs A 


n — 12 
writeBinary (6); 





完整 的 输出 是 : 

1100 

这 就 是 12 的 二 进 制 等 值 数 。 | 

在 前 面 的 国 数 定义 里 ，writeBinary 的 else 部 分 的 语句 顺序 使 得 我 们 可 以 推迟 所 有 的 输出 
操作 ， 直 到 计算 出 会 部 位 的 值 。 如 果 反 转 顺 序 ， 那么 这 些 位 就 会 以 反 序 打印 。 递 归 的 功能 如 
此 强大 ， 以 至 于 任何 一 个 微小 的 改变 都 会 带 来 巨大 的 影响 。 

和 通常 的 递归 函数 一 样 ， writeBinary 的 时 间 和 存储 空间 代价 与 递归 调用 的 次 数 成 正比 ， 
递归 调用 的 次 数 就 是 4 可 以 不 断 除 以 2 直到 等 于 1 的 次 数 。 正 如 第 3 章 的 分 裂 规 则 所 述 ， 这 个 值 
是 floor(logyn)， 因 此 worstTime(n) 和 worstSpace(n) 都 是 和 n 成 对 数 关系 的 。 

现在 由 读者 来 开发 一 个 迭代 函数 解决 这 个 问题 。( 可 以 参照 习题 4.2 的 提示 。) 在 完成 这 个 
迭代 函数 之 后 可 能 会 发 现 这 比 开发 递归 函数 要 难 。 这 是 典型 的 ， 甚 至 是 非常 明显 的 ;在 一 些 
适合 递归 的 问题 上 ， 递 归 方 案 通 常 比 迭代 方法 流畅 些 。 当 一 个 问题 的 复杂 实例 可 以 简化 成 一 
些 和 复杂 实例 形式 相同 的 小 实例 ， 并 且 最 小 的 实例 能 够 被 直接 处 理 时 ， EAE mie E RJ. 

实验 10 介 绍 了 另 一 个 递归 应 用 ， 这 在 自然 界 中 是 很 常见 的 。 


实验 10: 辈 波 纳 契 数 (所 有 的 实验 都 是 可 选 的 ) 


在 下 一 个 问题 里 ， 和 迭代 方案 比 递归 方案 更 难 开 发 了 。 
4.4 ie | 


在 汉 诺 塔 游戏 里 ， 有 三 根 杆 ;分 别 标 着 4. 了 3、C， 还 有 若干 大 小 不 同 的 编 着 号 的 盘子 ， 
每 个 盘子 的 中 心 有 一 个 洞 。 开 始 时 ， 所 有 的 盘子 都 在 杆 4 上 ， 并 且 最 大 的 盘子 在 最 底部 ， 然 后 
是 次 大 的 ， 等 等 。 图 4-1 显 示 了 四 个 从 小 到 大 编号 的 盘子 的 初始 配置 。 

游戏 的 目 标 是 将 所 有 的 盘子 从 杆 4 移 到 杆 B8 上 ; 杆 C 用 来 作 临 时 存放 只。 游戏 规则 是 

1) 每 次 只 能 够 移动 一 个 盘 。 

2) 不 :允许 大 盘 在 小 盘 上 面 。 

3) 除了 第 2 条 规则 的 限制 ， 每 根 杆 顶 部 的 盘子 可 以 移动 到 其 他 任 一 一 根 杆 上 。 





号、 有 此 版 本 中 泊 开 的 目标 是 将 直子 从 村 4 移 到 杆 C， 而 本 5 作 几 时 存放 
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现在 试 着 从 图 4-1 的 初始 配置 开始 玩 这 个 游戏 。 马 上 就 面临 一 个 进退 两 难 的 问题 : 将 盘 1 
移动 到 杆 B 上 还 是 杆 C 上 呢 ? 如 果 移 错 了 就 可 能 导致 最 终 四 个 盘子 都 在 杆 C 上 而 不 是 杆 B 上 。 





E 
图 4-1 四 个 盘 的 汉 诺 塔 游戏 的 初始 位 置 


不 去 考虑 盘 1 开 始 时 应 当 移 到 哪儿 ， 再 来 集中 精力 考虑 盘 4 一 一 最 底部 的 盘 。 当 然 不 能 马上 
把 盘 4 移 走 ， 但 是 最 终 盘 4 必须 从 杆 4 移 到 杆 B。 根 据 游戏 的 规则 ， 将 盘 4 移 走 之 前 的 配置 应 当 
如 图 4-2 所 示 。 

上 面 的 观察 有 助 于 解决 如 何 将 四 个 盘 从 4 移 到 有 吗 ? 确实 有 几 分 帮助 。 但 仍然 需要 决定 如 
何 将 三 个 盘 (每 次 只 移动 一 个 ) 从 杆 A 移 动 到 杆 C。 然 后 将 盘 4 从 A 移动 到 B: 最 后 再 决定 如 何 
将 三 个 盘 (每 次 只 移动 一 个 ) 从 杆 C 移 动 到 杆 B。 





图 4-2 将 盘 4 从 杆 4 移 到 杆 B 之 前 的 汉 诺 塔 游戏 配置 


这 个 策略 说 明 : 把 如 何 移动 四 个 盘子 的 问题 可 以 简化 成 如 何 移动 三 个 盘子 的 问题 。 再 就 
是 需要 决定 如 何 将 三 个 盘子 从 一 根 杆 移 到 另 一 根 杆 。 

但 是 前 面 的 策略 可 以 重复 应 用 ! 为 了 移动 三 个 盘子 ， 即 ， 从 杆 4 移 到 杆 C， 需 要 先 将 两 个 
盘子 从 A 移 到 B， 然 后 将 盘 3 从 A 移 到 C， 最 后 再 将 两 个 盘子 从 B 移 到 C。 持 续 地 简化 ， 最 终 任务 
将 是 把 盘 1 从 一 根 杆 移 到 另 一 根 上 。 

在 这 个 问题 上 4 这 个 数 没什么 特别 。 对 任何 一 个 正 整数 mx 都 能 描述 如 何 将 an 个 盘子 从 杆 4 移 
动 到 杆 B: 如 果 n=1， 就 是 将 盘 1 从 杆 A 移 动 到 杆 B。 如 果 n>1， 

D 首先 ， 将 n- 1 个 盘子 从 杆 4 移 动 到 杆 C， 使 用 杆 B 临 时 存放 盘子 ，。 

2) 然后 将 盘 n 从 杆 4 移 动 到 杆 B。 

3) 最 后 ， 将 n-1 个 盘子 从 杆 C 移 动 到 杆 B8， 使 用 杆 4 临 时 存放 盘子 。 

这 还 没有 彻底 解决 问题 ， 比 如 还 没有 描述 如 何 将 n-1 个 盘子 从 A 移 到 C。 但 是 这 个 策略 可 
以 很 容易 地 推广 ， 只 需要 将 常量 4、B3 和 C 替 换 成 变量 源 、 目 的 地 和 临时 杆 。 例 如 ， 将 变量 
ARAL: 
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=A 
目的 地 =B 
临时 杆 =C 
那么 把 n 个 盘子 从 源 移动 到 日 的 地 的 通用 策略 如 下 。 如 果 n 是 1， 把 盘 1 从 源 移 动 到 目的 地 。 
ff Wil , | 
D) 将 n 一 1 个 盘子 (每 次 移动 一 个 ) 从 源 移 动 到 临时 杆 。 
2) 将 盘 n 从 源 移动 到 日 的 地 。 
3) 将 盖 1 个 担子 《每 次 移动 一 个 ) 从 临时 杆 移动 到 目的 地 。 
以 下 的 递归 国 数 实现 了 这 个 策 酷 : 
// BRE APE: n>0， 
/ 后 置 条 件 : 需要 输出 将 n 个 盘子 从 杆 orig ( 源 ) 移动 到 杆 dest ( 目的 地 ) 
Hi Waa. Frtemp (临时 杆 ) 用 于 临时 存放 。 
// worstTime(n) 4E O(2"), 
void move (int n, char orig, char dest, char temp) 


{ 
if (n == 1) 
cout << "Move disk 1 from " << orig << "to" 
<< dest << endi; 
else 


move (n — 1, orig, temp, dest); 
cout << "Move disk " << n << " from " << orig 
<< "to" << dest << endi; 
move (n — 1, temp, dest, orig); 
) // else 
) // move 


跟踪 这 个 函数 的 执行 是 非常 困难 的 ， 因 为 参数 和 变 元 值 的 相互 干扰 ， 使 得 很 难 跟踪 当前 
哪个 杆 是 源 ， 哪 个 是 目的 地 ， 以 及 哪个 是 临时 杆 。 在 下 面 的 执行 结构 框架 里 ， 参 数 的 值 是 调 
用 中 的 变 元 的 值 ， 后 继 调 用 的 变 元 值 取 自 函数 代码 和 当前 参数 的 值 。 例 如 ， 假 设 初始 调用 是 

move(3，A， 'B', 'C'); 

那么 第 0 步 的 参数 值 将 会 是 那些 变 元 值 ， 因 此 可 以 得 到 

n-3 | 

orig = 'A' 

dest — 'B' 

temp - C 

因为 n 不 等 于 1， 所 以 执行 move 函 数 的 else 部 分 : 


move (n — 1, orig, temp, dest); 
cout << "Move disk" << n << "from" << orig << "to" << dest << endi; 
move (n — 1, temp, dest, orig); 


那些 变 元 的 值 又 从 参数 的 值得 到 ， 因 此 就 是 
move (2, 'A', 'C', 'B'y; 


DU 


i 


UE) 


cout << "Move disk 3 from A to B" << endl; 
move (2, 'C', 'B', 'A’); 

bi) SHE 

move(3, 'A', 'B', 'C); 


I} move Fk BC AY HP PREDA TETTE AR. CEJT A ETT ER En Z Be APR T RA fn] KA ZS Be (EAE 


元 值 。 


Pan=83 


orig = ‘A’ 

dest = ‘B’ 

temp = ‘C’ 

w move (2, ‘A’, ‘C’, ‘B’); 
cout << “Move disk 3 from A to B" << endl; 
move (2, ‘C’, ‘B’, ‘A’); 


| n=2 


orig = ‘A’ 

dest = ‘C’ 

temp = ‘B’ 

w move (1, ‘A’, 'B', ‘C’); 
cout << “Move disk 2 from A to C" << endl; 
move (1, ‘B’, ‘©’, ʻA’), 


n=3 

orig = ‘A’ 

dest = ‘B’ 
temp = ‘C’ 


|v move (2, 'A','C','B)); 


cout «« "Move disk 3 from A to B" «« endl; 


= n=1 


orig = ʻA’ 


| dest = 'B' 


temp = ‘C’ 


| v cout << “Move disk 1 from A to B” << endl; 


in=2 


orig = ‘A’ 


| dest = ‘C’ 


temp = ‘B’ 

w move (1, ‘A’, 'B', ‘C’); 
cout << “Move disk 2 from A to C" << endl; 
move (1, ‘B’, ‘C’, ʻA’); 


n=3 
orig = ‘A’ 


4| dest = 'B' 
中 temp = ‘C’ 


w move (2, ‘A’, ‘C’, ‘B’); 
cout << “Move disk 3 from A to B" << endl: 
move (2, ‘C’, ‘B’, ʻA’); 


将 盘 1 从 A 移 动 到 B 
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EI n=2 


orig — 'A 
dest = ‘C’ 


: i ^ temp - B 


move (1, ‘A’, ‘B’, ‘C’); 
/ cout << “Move disk 2 from A to C" << endl; 
move (1, ‘B’, ‘C’, 'A); 


n-3 

orig = ‘A’ 

dest = ‘B’ 

temp = ‘C’ 

w move (2, 'A, ‘C’, ‘B’); 
cout << “Move disk 3 from A to B” << endl: 
move (2, 'C', 'B', 'A); 


n=2 
orig = ‘A 
dest = ‘C’ 
temp = ‘B’ 
move (1, ‘A’, ‘B’, ‘C’); 
cout << “Move disk 2 from A to C" << endl: 
w move (1, ‘B’, ‘C’, 'Ay; 


n=3 

orig = ‘A’ 

dest = ‘B’ 

temp = ‘C’ 

X. move (2, ‘A, ‘C’, ‘B’); 
cout << “Move disk 3 from A to B" << endl; 
move (2, ‘C’, ‘B’, ‘A’); 


n=1 

orig = 'B' 

dest = ‘Ç’ 
temp = ‘A’ 


w cout << "Move disk 1 from B to C" << endl; 


n-2 
orig = ‘A’ 
dest = ‘C’ 
temp = ‘B’ 
move (1, ‘A, ‘B’, ‘C’); 
cout << “Move disk 2 from A to C” << endl: 


suc] Y move (1, ‘B’, ‘C’, ʻA’); 


将 盘 ? 从 A 移 动 到 C 


将 盘 1 从 B 移 动 到 C 





g4* 


“1 n=3 

orig = ‘A’ 

dest = ‘B’ 

temp = ‘C’ 

| V move (2, ‘A, ‘C’, ‘B’); 
cout << “Move disk 3 from A to B" << endl; 
move (2, ‘C’, ‘B’, 'A); 


n=3 

orig = ‘A’ 

dest = 'B' 

temp = ‘C’ 
move (2, ‘A’, ‘C’, ‘B’); 

V cout << "Move disk 3 from Ato B” << endl; | 将 盘 3 从 A 移 动 到 B 
move (2, ‘C’, ‘B’, ‘A’; 


n=3 
orig = ‘A’ 
dest = ‘B’ 
temp = ‘C’ 
move (2, ‘A’, ‘C’, ‘B’); 
cout << “Move disk 3 from A to B” << endl: 
.] 4 move (2, 'C', 'B', 'A); 


n-2 

orig = 'C' 

dest = 'B' 

temp = ‘A’ 

/ move (1, ‘C’, ‘A’, ‘B’): 
cout << “Move disk 2 from C to B” << endl; 
move (1, ‘A’, ‘B’, ‘C’); 


n=3 
orig = ‘A’ 
dest = ‘B’ 
temp = ‘C’ 
move (2, ‘A’, ‘C’, ‘B’); 
cout << “Move disk 3 from A to B" << endl; 
/ move (2, ‘C’, 'B', 'A); 





V cout << "Move disk 1 from C to A" << endl: | 将 盘 1 从 C 移 动 到 A 
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n=2 

orig = ‘C’ 

dest = ‘B’ 

temp = ‘A’ 

w move (1, ‘C’, ‘A, ‘B’); 
cout << “Move disk 2 from C to B” << endl: 

move (1, ‘A, ‘B’, ‘C’); 


* ‘Step 9: 









n-3 
orig = ‘A’ 
dest = ‘B’ 
temp = ‘C’ 
move (2, ‘A’, ‘C’, ‘B’): 
cout << "Move disk 3 from A to B" << endl: 
/ move (2, ‘C’, 'B', 'A); 












n=2 

orig = ‘C’ 

dest = ‘B’ 

temp = ‘A’ 
move (1, ‘C’, ‘A’, ‘B’): 

V cout << “Move disk 2 from C to B" << endl: 

move (1, ‘A’, ‘B’, ‘C’); 
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ea n=3 
| orig = ‘A’ 
dest = ‘B’ 
temp = ‘C’ 
move (2, ‘A’, ‘C’, ‘B’); 
cout << "Move disk 3 from A to B" << endl: 
w move (2, 'C', 'B', ‘A); 












n=2 
orig = ‘C’ 
dest = ‘B’ 
temp = ‘A’ 
move (1, ‘C’, ‘A’, ‘B’); 
cout << “Move disk 2 from C to B” << endl: 
/ move (1, ‘A, B, CF 











n=3 
orig = ‘A’ 
dest = ‘B’ 
temp = ‘C’ 
move (2, ‘A’, ‘C’, ‘B’); 
cout << “Move disk 3 from A to B” << endl: 
4 move (2, 'C', ‘B’, 'A); 















HAE LL M uL E. uu RA ECE A 


sa n=1 
orig = ‘A 
dest = 'B' | 
ul temp = ‘C’ ae 
A ES = ; wat << "Move disk 1 from A to B" < << < endi, 将 盘 1 从 A 移 动 到 B 


move (1, ‘C’, ‘A’, ‘B’); 
cout << “Move disk 2 from C to B" << endl: 
| Y move (1, ‘A’, ‘B’, ‘C’); - 


orig = ‘A’ 
Rae | dest = 'B' 
«Kw temp = ‘C’ 
move (2, ‘A’, ‘C’, 'B'); 
gs ee cout << “Move disk 3 from A to B” << endl: 
pes vc move (2, ‘CB, AT 





OE FE A 7s HH AS — Be: BI BU a ic YH AS BB Wh FS Ht BR 
V8 — PHRExmove(15,'A', 'B', 'C' ages Mrs MR FIST MRI A. VERLA 
很 好 地 处 理 这 种 乏味 的 琐事 。 开 发 者 “只 ”需要 编制 正确 的 程序 而 由 计算 机 来 执行 。 对 move 
函数 以 及 这 一 章 中 的 其 他 递归 函数 ， 和 见习 题 4.17。 

递归 函数 不 能 明确 地 描述 执行 中 涉及 的 大 量 细 节 。 因 此 ， 递 归 有 时 被 看 作 是 “懒惰 的 编 
程 者 的 问题 解决 工具 ”。 如 果 想 显示 递归 的 价值 ， RRNA ATE A move re BE IR. 编 
no" CHE | 


一 个 递归 关系 


当 n 是 盘子 的 数量 时 ，worstTime(n) 是 多 少 ? 在 确定 递归 函数 的 时 间 需 求 时 ， 对 函数 的 调 
用 次 数 是 极为 重要 的 。 让 c(n) 等 于 一 个 给 定 n 值 的 move 函 数 的 调用 次 数 。 那么 对 任何 一 个 正 整 
Bin , worstTime(n) = c(n), 因此 现在 需要 做 的 就 是 求 c(n) 的 量 级 ， 再 根据 它 来 求 worstTime(n)。 
当 n=1 时 ， 只 用 了 一 个 move 调 用 ; 因此 c(1)=1。 对 n>1， 用 n 作 为 第 一 个 变 元 进行 move 的 初始 
调用 ， 在 这 个 调用 中 又 使 用 了 两 个 以 n- 1 作为 第 一 个 变 元 的 move 调 用 。 即 ， 对 n>1， 
| | c(n) = 1 + 2c(n — 1) 


这 个 等 式 称 作 一 个 递归 关系 ， 因 为 c(n) 的 定义 是 来 自 于 它 前 面 的 值 的 。 对 n>2， 可 以 按照 
以 下 方式 计算 ce(z-1): ,开始 调用 move， sii la NET PAE 2 作为 第 一 个 变 元 的 
move fh . Bins TAR i 


‘cn = 1) = 1 + 2e(n ~ 2) 
如 果 将 这 个 等 式 代 换 进 第 一 个 < 的 等 式 ， 对 n>2 的 情况 ， 就 可 以 得 到 








c(n) = 1 + 2c(n — 1) 
= | + 2[1 + 2c(n — 2)] 
= 3 + 4c(n — 2) 
对 n>3， 间 样 可 以 代 换 得 到 
c(n) = 3 + 4c(n — 2) 
= 3 + 4[1 + 2c(n 一 3)] 
= 7+ 8c(n — 3) 
IX BRIG MT — "PUE S EAE Ben Ak Bn, A: 
c(n) = 2* — | + 2e(n — k) 
Mn-k-lB[, (CRRA IE. Al TL kn- 1 时 ， 
c(n) = 277) —] + 2" Ted) 
= 2-1-1 + 2-11) 
= 27 — | 
这 些 可 以 用 数学 归纳 法 证 明 。 计 算 结 果 c(n) 是 0(2")， 因 此 worstTime(n) 也 是 0(2")， 并 且 是 
最 小 的 。 也 就 是 说 ， 如 果 worstTime(m) 也 是 O(8) (8 是 其 他 函数 ) ， 那 么 0(2) C O(8)。 由 于 任 
何 用 来 解决 汉 诺 塔 问 题 的 函数 都 必须 做 至 少 2" 次 移动 ， 所 以 任何 一 个 这 类 的 函数 将 耗费 指数 
级 的 时 间 代 价 ， 这 意味 着 汉 诺 塔 问 题 是 很 难处 理 的 。 
move 的 存储 需求 是 比较 适中 的 ， 因 为 尽管 调用 move 时 会 占用 空间 ， 但 当 调 用 结束 后 就 会 
释放 空间 。 因 此 move 需 要 的 额外 存储 数量 不 仅仅 依赖 于 move 的 调用 次 数 ， 而 且 依 赖 于 开始 但 
是 尚未 结束 的 调用 的 最 大 数量 。 可 以 利用 执行 结构 框架 计算 这 个 数字 。 每 次 进行 一 个 递归 调 
用 ， 束 会 构造 男 一 个 执行 结构 框架 ， 并 且 每 次 调用 返回 ， 都 会 删除 一 个 执行 结构 框架 。 例 如 ， 
如 琳 用 n=3 进 行 第 一 个 move 调 用 ， 那 么 执行 结构 框架 的 最 大 数量 就 是 3。 通 常情 况 下 ， 执 行 结 
构 框 架 的 最 大 数 都 是 x。 因 此 worstSpace(n) 和 nn 是 成 线性 关系 的 。 | 
4.5 市 提 及 了 解决 问题 的 一 个 通用 策略 一 一 回 滴 ， 这 种 策略 就 是 为 了 菜 些 目的 需要 按 原先 
步骤 折 回 的 方法 。 从 某 个 回溯 应 用 的 组 成 中 抽象 出 所 有 回溯 应 用 都 需要 的 组 件 ， 这 是 有 很 重 
要 的 意义 的 。 


4.5 回溯 


回潮 的 基本 思想 是 : 如 何 从 一 个 给 定 的 起 始 位 置 到 达 目 的 地 。 重 复 地 选择 ， 也 可 能 是 猜 
测 ， 下 一 个 位 置 是 什么 。 如 果 假 设 的 选择 是 正确 的 一 一 也 就 是 说 ， 新 位 置 可 能 在 通 往 目 的 地 
的 路 上 ， 那 就 前 进 到 这 个 新 的 位 置 上 继续 。 如 果 这 个 选择 进入 了 死胡同 ， 就 返回 前 一 个 位 置 
并 进行 另 一 个 选择 。 回 溯 就 是 通过 一 系列 的 位 置 选择 并 从 不 能 到 达 目 的 地 的 位 置 逆 序 折 返 ， 
从 而 最 终 到 达 目 的 地 的 策略 。 

例如 ， 观 察 图 4-3。 从 P0 位 置 想 找到 一 条 路 径 通 往 目 的 地 P16， 只 人 允许 向 两 个 方向 移动 一 
北 和 西 。 策 略 是 : 从 任何 一 个 位 置 上 出 发 ， 首 先 试 着 向 北 ; 如 果 不 能 向 北 ， 再 试 着 向 西 ， 如 
果 不 能 向 西 ， 就 返回 前 面 选择 向 北 的 最 近 的 一 个 位 置 并 转 而 向 西 。 在 每 次 移动 后 ， 检 查 结果 ， 
即 是 否 到 达 目 的 地 。 根 据 该 策略 所 确定 的 移动 的 顺序 ， 我 们 对 图 4-3 里 的 位 置 编 了 号 。 

图 4-3 中 可 以 看 到 “逆序 折返 ”。 当 从 位 置 P4 不 能 向 北 或 向 西 时 ， 首 先 返回 位 置 P3。 它 没 
有 问 西 的 选择 ， 因 此 返回 P2。 从 位 置 P2， 可 以 选择 向 西 ， 于 是 到 达 P5， 它 没有 向 北 的 选择 ， 








但 是 可 以 向 西 ， 于 是 移动 到 P6， 再 向 北 移动 到 P7， 这 是 一 个 死胡同 。 然 后 折 回 P1， 并 向 西 移 
动 到 P8。 从 P8 不 会 再 向 北 移动 到 P5， 因 为 已 经 发 觉 了 P5 将 通 向 一 个 死胡同 。 因 此 从 P8 向 西 并 
最 终 到 达 目 的 地 。 


P 16 (Goal) 
P15 


t 
P14 P7 


t t 
P13 Pil P6 «——— P5«—— — P2 


t t t f 


P12 «4— —— P 10 e——P9 e P8 eP! 


PO 


图 4-3 回溯 获取 通 往 目的 地 的 路 径 。 得 到 的 结果 是 PO、P1、 
P8. P9, P10, Pi2, P13, P14, P15, P16 


通 往 目的 地 的 路 径 不 应 该 包含 任何 死胡同 ， 这 正 说 明了 回溯 的 一 一 个 微妙 之 处 。 访 问 一 个 [112] 
位 置 时 ， 将 把 它 记 录 在 通 往 目 的 地 的 路 径 上 。 但 是 如 果 这 个 位 置 只 不 过 到 达 一 个 死胡同 ， 那 
将 取消 这 个 记录 。 

现在 可 以 使 用 Wirth(1976, p. .138) 发 现 纲 的 类 回溯 算法 ， 而 无 需 为 每 个 具体 应 用 开发 回溯 方 
法 。 下 面 将 展示 一 个 具体 应 用 中 的 算法 。 即 将 讨论 的 BackTrack 类 基于 Noonan(2000) 中 的 一 个 
X. Application 类 的 实现 细节 在 BackTrack 类 中 是 无 法 访问 到 的 ， 它 要 通过 头 文 件 
Application.h 访 问 。 相 应 的 源 文件 将 在 具体 应 用 里 实现 。 

BackTrack 类 的 用 户 提供 了 

* 一 个 源 文件 实现 Application.h U 

* 一 个 Position 类 ， 它 定义 了 在 这 个 应 用 里 “位 置 ”的 音义 。 

任何 回溯 应 用 都 使 用 相同 的 main 函 数 、 BackTrack X fe Application 3; X fF, 

Application 方 法 对 图 4-3 之 前 和 之 后 的 讨论 都 是 通用 的 ， 例 如 ， 其 中 一 个 方法 测试 给 定 的 
位 置 是 否 有 效 ， 即 是 否 在 通 往 目 的 地 的 一 条 路 上 。 PREACH Application h, 它 还 声明 了 一 
个 Iterator 类 ， 用 来 从 一 个 给 定位 置 上 进行 迭代 : 


#ifndef APPLICATION 
#define APPLICATION 





#include <iostream> 
#include "Position.h" 


using namespace std; 


class Application 
{ 
friend ostream& operator<< (ostream& stream, 


Applications app); 
/. public: | 
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/ 后 置 条 件 : 返回 这 个 利用 输入 或 赋值 生成 的 
Hf Application 的 初始 状态 以 及 
// 起 始 位 置 。 


Position generatelnitialState( ); 


/ EARI: 如 果 pos 在 通 往 目 的 地 的 路 上 就 返回 真 。 
Ii 否则 将 返回 假 。 


bool valid (const Position& pos); 


/ 前 置 条 件 : pos 代 表 了 -- 个 有 效 位 置 。 
/ Ja ARTE: pos 被 记录 成 一 个 有 效 位 置 。 


void record (const Position& pos); 


// Ji E ARTE: 如 果 pos 是 这 个 应 用 的 最 后 一 个 
if fr A EIR EL, dri 

i 返回 假 。 

bool done (const Position& pas): 


/ Ja BAe: pos 被 标记 为 不 在 通 往 目的 
// 地 的 路 径 上 。 


void undo (const Position& pos); 


class Iterator 


{ 
public: 


/ 后 置 条 件 : 这 个 lterator 被 初始 化 。 
Iterator ( ); | | 


/ J3 E A& fF: 用 pos 进 行 这 个 lterator 的 初始 化 。 


lterator (const Position& pos); 


/ 前 置 条 件 : 这 个 Herator 可 以 从 这 个 位 置 前 进 。 
JAERI: 返回 这 个 lterator 的 当前 位 置 ， 并 将 
Moo 这 个 lterator 前 进 到 

Hf 下 一 个 位 置 。 

Position operator+ + (int); 


IRER: 这 个 lterator 再 也 不 能 前 进 了 。 
bool atEnd( ); 
protected: 
void" fieldPtr — // 以 后 解释 
)//3&Iterator 
}V Application 


#endif 
Application 类 不 需要 任何 字段 ， 因 为 每 个 问题 都 是 Application 的 一 个 实例 。 也 就 是 说 ， 每 
个 应 用 ， 即 这 个 类 的 每 个 实现 中 的 任何 字段 都 可 以 改变 。 取 而 代 之 的 是 ， 对 每 个 实现 将 在 与 
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Application.h 对 应 的 源 文 件 中 分 别 定义 一 些 专用 的 变量 。 

另 一 方面 ， 对 一 个 具体 应 用 ， 和 仍 人 的 Iterator 类 将 有 若干 实例 ， 因 此 需要 字段 来 区 分 不 同 
的 迭代 器 对 象 。 但 是 不 同 应 用 的 Iterator 类 的 字段 也 应 各 不 相同 。 通 过 定义 一 个 虚 字 段 fieldPtr， 
使 得 Application 类 的 每 个 实现 可 以 为 具体 应 用 指定 实际 的 字段 。 对 应 一 个 具体 的 应 用 ， 下 面 
小 闻 中 给 出 了 详细 的 实现 细节 。 

BackTrack 类 是 通用 的 : 没有 任何 特定 于 应 用 的 信息 。 头 文件 如 下 : 


#ifndef BACKTRACK 
#define BACKTRACK 


#include "Application.h"; 
#include "Position.h"; 


class BackTrack 


{ 
public: 


/ 后 置 条 件 : 通过 app 初 始 化 这 个 BackTrack 对 象 。 
BackTrack (const Application& app); 


BRE: 尝试 一 条 通过 pos 的 路 径 。 


/l AU AR S ALIAD CR 

// 回 真 ; 否则 

// J BER. 

bool tryToSolve (Position pos); 
protected: 


Application app; 
y; // 3&BackTrack 


ttendif 


现在 关注 一 下 tryToSolve 方 法 ， 它 是 回溯 的 基础 。 对 任意 pos 值 ， 创 建 一 个 从 那个 位 置 开 
始 的 达 代 器 ， 并 循环 直到 成 功 或 再 也 无 法 进行 下 去 。 在 每 次 循环 迭代 过 程 中 需要 检测 由 迭代 
各 产生 的 下 一 个 移动 。 下 面 列 出 了 三 种 可 能 : 

1) 那些 选择 之 一 是 目的 地 。 那 么 循环 终止 并 返回 真 ， 表 示 成 功 。 

2) 那些 选择 之 一 是 有 效 的 ， 但 不 是 目的 地 。 那 么 从 这 个 有 效 选 择 开始 进行 一 个 递归 调用 
tryToSolve, | 


3) 所 有 的 选择 都 不 是 有 效 的 。 那 么 循环 结束 并 返回 假 ， 表 示 从 当 前 位 置 不 能 到 达 目 的 地 。 
下 面 是 源 文件 BackTrack .cpp: 


#include “BackTrack.h" 
using namespace std; 


BackTrack::BackTrack (const Application& app) 
{ 

this -> app = app; 
) W 构造 器 


bool BackTrack:::tryToSolve (Position pos) 
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bool success = false; 


Position::Iterator itr = pos.begin( ); 
while (!success && itr!- pos.end( )) 
{ 
pos = itr+ +; 
if (app.valid (pos)) 
{ 
app.record (pos); 
if (app.done (pos)) 
success = true; 
eise 
{ 
success = tryToSolve (pos); 
if (Isuccess) 
app.undo (pos); 
y 取消 
) /一 个 有 效 位 置 
) // while 
return success; 
) / JjiktryToSolve 


tryToSolve 的 变 元 代表 一 个 有 效 并 被 记录 的 位 置 。 无 论 何 时 从 tryToSolve 返 回 ， 就 恢复 pos 
前 一 个 调用 的 值 ， 如 果 它 通 向 死胡同 就 取消 它 的 标记 。 | 

main S 2 82516 AFF AE ion tK ds. generatelnitialState Fy 2; A] 8E VE A RSE wa Be 
在 这 两 种 情况 下 ， 该 方法 都 将 返回 初始 位 置 并 记录 ; 初始 位 置 是 不 能 被 回溯 的 。 对 tryToSolve 
的 初始 调用 最 终 将 返回 成 功 或 失败 : 如 果 成 功 ， 就 输出 应 用 的 最 终 状 态 。 

下 面 是 BacktrackMain.cpp: 


#include <iostream> 
#include <string> 
#include "BackTrack.h" 
#include "Application.h" 
#include "Position.h" 


using namespace std: 


int main( ) 
{ 
const string INITIAL_STATE = 
"The initial state is as follows:\n": 
const string SUCCESS = 
“\n\nA solution has been found:"; 
const string FAILURE = 
"\n\nThere is no solution:": 
const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


Application app; 





BackTrack b (app); 


cout << INITIAL_STATE; 
Position start = app.generateinitialState( ); 
cout << app; 
if ('app.valid (start)) 
cout << FAILURE << endl; 
else 
{ 
app.record (start); 
if (app.done (start) || b.tryToSolve (start)) 
cout << SUCCESS << endl << app; 
else 


{ 
app.undo (start); 
cout << FAILURE << endl: 
) / 失败 
) // start 有 效 


cout << endl << endl << CLOSE WINDOW PROMPT; 
cin.get( ); 


return 0; 
) // main 


MERREN, HANER RS HI ERI. Pih 
中 描述 了 一 个 这 样 的 问题 ， 编 程 项 目 4.2 和 编程 4.3 中 还 有 两 个 ， 第 14 章 中 还 将 遇 到 一 个 。 


令 人 惊奇 的 应 用 


为 了 了 解 回溯 的 应 用 ， 让 我 们 来 开发 一 个 程序 一 在 迷宫 里 寻找 路 径 。 例 如 ， 图 4-4 表 示 
了 一 个 7 x 13 的 迷宫 ， 其 中 1 代表 通道 ，0 代 表 墙 。 在 迷宫 里 只 人 允许 水 平和 垂直 移动 ; 禁止 斜 向 
的 移动 。 起 始 位 置 必须 是 1， 在 左上 和 角 ， 目 的 地 在 右 下 角 。 





图 4-4 一 个 迷宫 : 1 代表 通道 ，0 代 表 墙 。 假 设 起 始 位 置 在 左上 角 ， 目 的 地 在 右 下 角 


对 这 个 迷宫 ， 一 个 成 功 的 遍历 将 会 产生 一 条 从 起 始 位 置 到 目的 地 的 路 径 ， 然 后 把 每 个 这 
样 的 位 置 标记 上 9。 因 为 在 这 个 迷宫 里 有 两 条 可 行 的 路 径 ， 所 以 最 后 选择 哪 条 路 径 取 决 于 和 迭 
代 器 如 何 排序 各 个 选择 。 为 了 具体 描述 ， 先 假设 这 些 选 择 按照 北 、 东 、 南 和 西 排序 。 例 如 ， 
从 坐标 (5, 8) 的 位 置 开 始 ， 第 一 个 选择 应 当 是 4，8) ， 然 后 依次 是 (5，9)、(6，8) 和 
(5, 7). 
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以 (0, 0) 作为 初始 位 置 ， 下 面 的 这 些 位 置 可 能 出 现在 最 后 的 路 答 上 ， 因 此 被 记 承 : 

(0,1)W 向 东 移 动 

(0,2)// [8] Z1 zl) 

(1 ,2)// fh) Ej T oh 

(1,3)//]] ARAB 5J 

(1.4)//]] ARAB 

(0,4)// 向 北 移 动 

(0,5)// In] AR FB 5j 

这 里 最 后 一 个 位 置 是 个 死胡同 ， 因 此 取消 (0,，5) 和 (0, 4) 的 标记 ， 回 调 到 (1, 4), 
然后 记录 : 

(2,4)// fà] Bj E zJJ 

(3,4)// ji] PE AB oh 

(3,5)// T8] ARAB z) 

最 后 义 到 达 一 个 死胡同 。 取 消 (3，5) 的 标记 之 后 ， 折 回 (3，4)， 然 后 前 进 一 一 不 再 需 
要 任何 回 诗 ， 到 达 目 的 地 。 图 4-5 显 示 了 穿越 图 4-4 所 示 迷 宫 的 相应 路 径 ， 在 路 径 上 的 位 置 用 9 
表示 ， 死 胡同 用 2 表示 。 


9990220002222 
1099902222202 
1000902020202 
1000922020222 


1111900001000 
0000900000000 
0000999999999 





图 4-5 穿越 图 4-4 的 迷宫 的 一 条 路 径 。 在 路 径 上 的 点 用 9 表示 ， 死 胡同 用 2 表示 


在 这 个 应 用 里 ， 一 个 位 置 只 是 一 对 坐标 : 行 ， 列 。Position 类 是 很 容易 开发 的 ， 下 面 是 
Position.h: 


#ifndef POSITION 
#define POSITION 


class Position 
{ 
protected: 
int row, 
column; 


public: 
| Position( ); 
Position (int row, int column); | 
void setPosition (int row, int column); 
int getRow( ); 
int getColumn( ); 
}; // 3&Position 


#endif 
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然后 是 Position.cpP: 
#inctude "Position.h" 


Position::Position( ) 
{ 
row = QO; 
column = 0; 


} / 缺 省 构造 器 


Position::Position (int row, int column) 
{ 

this —> row = row; 

this —> column = column; 


) // Tx a 


void Position::setPosition (int row, int column) 


{ 

this —— row = row; 

this —> column = column; 
) // Jj iksetPosition 


int Position::getRow( ) 
{ 


return row; 
) // 方法 9etRow() 


int Position::getColumn( ) 


{ 


return column; 
) // JjikgetColumn() 


头 文 件 Application.h 在 Maze.cpp 中 得 到 实现 。 
Maze.cpp: | 


#include <iostream> 

#include "Application.h" 

const short WALL = O; 

const short CORRIDOR = 1; 
const short PATH = 9; 

const short TRIED = 2; 

const short ROWS = 7; 

const short COLUMNS = 13; 
short grid ROWS][COLUMNS} = 
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ix 
(1, 0, 0, 0, 1,0, 1, 0, 1, 0, 1, 0, 1}, 
(1,0,0,0,1,1, 1,0, 1,0, 1, 1, 1) 
(1. 1, 1, 1, 1, 0, 0, O, 0, 0, 0, 0, O}, 
(0,0, 0, 0, 1,0, 0, 0, O, O, O, 0, 0}, 
(0, 0, 0,0, 1, 1, 1, 1, 1, 1, 1, 1, 1) 
y; // grid 


Position start, 
finish; 


using namespace std; 


Position Application::generatelnitialState( ) 


{ 
const string START_PROMPT = 
"Please enter the start row and start column: "; 
const string FINISH_PROMPT = 


“Please enter the finish row and finish column: ": 


int row, 
column; 


cout << START. PROMPT; 
cin >> row >> column; 
Start.setPosition (row, column); 
cout << FINISH. PROMPT; 
cin >> row >> column: 
cin.get( ); 
finish.setPosition (row, column); 
return start; 

| // 方法 generatelnitialState 


bool Application::valid (const Position& pos) 
{ 

If (pos.getRow( ) >= 0 && pos.getRow( ) < ROWS && 
pos.getColumn( ) >= 0 && pos.getColumn( ) < COLUMNS && 
grid [pos.getRow( )][pos.getColumn( )] = = CORRIDOR) 

return true; 

return false; 


) // 方法 valid 


void Application::record (const Position& pos) 
{ 

grid [pos.getRow( )][pos.getColumn( )} = PATH: 
) // 方法 record 


bool Application::done (const Position& pos) 
{ 
return pos.getRow( ) == finish.getRow( ) && 
pos.getColumn( ) == finish.getColumn( ); 
) // 方法 done 








e 95 


void Application::undo (const Position& pos) 


{ 
grid [pos.getRow( )][pos.getColumn( )] = TRIED; 


) // 方法 undo 


ostream& operator<< (ostream& stream, Application& app) 
{ 

cout << endl; 

for (int row = 0; row < ROWS; row+ +) 


{ 
for (int column = 0; column < COLUMNS; column 4 +) 


cout << grid [row][column] << ''; 
cout << endl; 
) // 外 部 for 
return stream; 
)/ 运算 符 << 
在 Maze.cpp 中 ， 常 量 和 变量 标识 符 (如 WALL、CORRIDOR、grid、start 和 finish) 都 
不 是 字段 ， 因 为 它们 只 有 在 Application 的 迷宫 实现 里 才 有 意义 。 
Maze.cpp 的 其 余部 分 是 给 入 类 Iterator 的 开发 。 这 个 类 有 三 个 int 字 段 : 
row 1// 这 个 迭代 器 的 当前 行 
column // 这 个 迭代 器 的 当前 列 
direction // 这 个 迭代 器 的 方向 : 0 代表 北 ，1 代 表 东 ，2 代 表 南 ，3 代 表 西 
但 是 一 个 类 的 字段 必须 在 头 文件 里 而 不 是 源 文 件 里 定义 。 现 在 面临 一 个 困难 的 选择 : k 
文件 Application.h 是 通用 的 ， 因 此 它 不 能 包含 任何 专门 的 迷宫 应 用 信息 。 利 用 一 个 void 指针 
可 以 让 我 们 走出 困境 : 
void "fieldPtr: 


这 给 人 的 第 一 印象 是 void 指 针 指 向 空 。 但 实际 上 恰恰 相反 : 任何 类 型 的 指针 都 可 以 分 配 
给 一 个 void 指针 ! 例如 ， 可 以 使 用 下 列 程序 : 

void" ptr; 

int" intPtr = new int; 

string* stringPtr — new string; 

*intPtr — 50; 

ptr — intPtr; 

cout << *(int*)ptr << endl; 

*stringPtr — "yes"; 

ptr — stringPtr; 

cout << *(string*)ptr << endi; 

输出 将 是 : 

50 

yes 
注意 在 这 个 代码 里 ，vold 指 针 被 脱 引用 之 前 必须 将 void 指针 明确 转换 为 一 个 具体 的 指针 
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头 文 件 Application.h 里 将 fieldPtr 定 义 成 一 个 void 指针 ， 而 在 源 文 件 Maze.cpp 里 声明 了 一 
Sita (所 有 成 员 都 是 公有 的 类 )， 它 有 三 个 字段 : 


struct itrFields 
{ 
int row, 
column, 
direction; 
}; // itrFields 


Iterator fy #4) 1 as A fieldPtr4> Ad — ^ JE X ix -structig£ Me, JEH eis ERI 
atEnd() 方 法 利用 (通过 类 型 转换 ) *fieldPtr 的 结果 值 。 下 面 给 出 了 Tterator 方 法 的 实现 : 


Application::Iterator::Iterator (Position pos) 

{ 
itrFields* itrPtr = new itrFields; 
itrPtr 一 > row = pos.getRow( ); 
itrPtr 一 > column = pos.getColumn( ); 
itrPtr 一 > direction = OQ: 
fieldPtr = itrPtr; 


) / 构造 器 
Position Application::Iterator::operator-- + (int) 
{ 
itrFields* itrPtr = (itrFields")fieldPtr; 
int nextRow = itrPtr —> row, 
nextColumn = itrPtr 一 > column; 
switch (itrPtr -> direction+ +) 
{ 
. case 0: nextRow = itrPtr — row — 1; // Jt 
break; 
case 1: nextColumn = itrPtr -> column + 1; // 东 
break; | 
case 2: nextRow = itrPtr -> row + 1; // Bj 
break; ' 
case 3: nextColumn = itrPtr —— column — 1; // P5 
) // switch; 
Position next (nextRow, nextColumn); 
return next; 
} 运算 符 ++ 
bool Application::Iterator::atEnd( ) 
{ 
return ((itrFields*)fieldPtr) — > direction >= 3; 
) // 方法 atEnd 


因为 fieldPtr 是 Iterator 里 的 一 个 字段 ， 所 以 对 Iterator 的 每 个 实例 都 有 一 个 fieldPtr 的 拷贝 。 
因此 即使 在 对 tryToSolve 的 不 同 递归 调用 过 程 中 创建 了 各 HAERE, EERE LRE CH 








己 的 fieldPtr。 可 以 避免 void 指 针 指 癌 grid 字 段 的 原因 是 由 于 在 应 用 里 只 有 一 个 grid 字 段 ， 因 此 
不 需 担 心 多 个 grid 实 例 的 交叉 影响 。 

不 是 采用 单 步 跟踪 ， 而 是 列 出 初始 调用 tryToSolve(pos)(( 其 中 pos=(0,0)) 之 后 的 前 几 个 有 
效 选 择 : 

(0,1)//]8] ZR $2 zJ) 

(0,2)//]8] ARAB 

(1,2)// 回 南 移动 

(1,3)//]8] ARB z) 

(1,4)//18] ARB zJj 

(0,4)//T9] JC AB ah 

(0,5 ARB; 死胡同 ; 折 回 (1,4) 并 重新 选择 

(2,4)//13] PF z) 

(3,4/1) Bj T2 zJ) 

(3,5)//]R] ARB oh; 开始 通 向 死胡同 

tryToSolve 方 法 在 这 个 应 用 里 耗费 了 多 长 的 时 间 ? 假设 迷宫 有 nn 个 位 置 。 在 最 坏 情 况 下 ， 
如 图 4-6 所 示 ， 每 个 位 置 都 被 考虑 到 、 因 此 worstTime(n) 和 n 成 线性 关系 。 而 且 有 一 大 半 的 位 置 
是 有 效 的 ， 所 以 有 O(n) 次 tryToSolve 的 递归 调用 ， 因此 worstSpace(n) 也 和 n 成 线性 关系 ，。 





图 4-6 最 坏 情 况 下 的 迷宫 : 9/1, 4, 7, RT 
最 后 一 行 全 是 0， 而 在 迷宫 的 其 他 位 置 都 是 1 


编程 项 目 4.2 和 编程 4.3 包 含 了 回溯 的 两 个 应 用 。 由 于 刚才 的 例子 把 回 湖 和 迷宫 遍历 分 开 讨 
论 ， 所 以 BackTrack 类 和 Application 头 文件 在 新 项 目 里 都 没有 改变 ， 主 函数 也 是 一 样 | 实际 上 ， 
在 编程 项 目 4.2 和 编程 4.3 里 * Positioa 类 也 没有 变化 ， 了 完成 编程 项 目 432 和 编程 4.3y 所 有 要 
做 的 只 是 去 实现 Application.h 。 

现在 回 过 来 关注 一 一 下 查找 技术 一 折 半 查找 ， ARAL Han, 
RE GERBER BIT THAR. 7 


4.6 ” 折 半 查找 


假设 要 在 数组 中 查找 一 项 。 最 简单 的 方法 是 顺序 查找 : 从 第 一 个 位 置 开始 ， 持续 地 向 后 
查找 ， 直 到 找到 这 个 项 或 是 到 达 数 组 的 尾部 。 这 个 查找 策略 称 作 顺序 查找 ， 年 mgorithh 里 的 
通用 型 算法 find 的 基础 : 


IR 





w 
A 
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template <class Inputlterator, class T> 

Inputlterator find (Inputlterator first, // 定位 于 容器 中 的 第 1 项 
Inputiterator last, / 定位 于 容器 中 最 后 一 项 之 后 
const T& value) 


while (first !— last && “first != value) 
+ +first: 
return first: 
} 
这 个 算法 应 用 在 容器 对 象 (使 用 选 代 器 ) 上 和 应 用 在 数组 (使 用 指针 ) 上 一 样 成 功 。 例 
an, 可 以 顺序 查找 一 个 employees 的 Linked 容 器 或 是 由 20 个 salaries 组 成 的 数组 : 
Linked<Employee>::lterator itr = find (employees.begin( ), 
employees. end( ), newEmployee); 
double* salaryPtr = find (salaries, salaries + 20, newSalary); 
if (itr != employees.end( )) 
cout << "newEmployee found!" << endl: 
if (salaryPtr != salaries + 20) 
cout << "newSalary found at index" << (salaryPtr — salaries); 


在 数组 的 顺序 查找 里 ， 如 果 查 找 不 成 功 就 出 现 了 最 坏 时 间 花 费 。 如 果 那 样 的 话 ， 必 须 扫 
描 整 个 数组 ， 因 此 worstTime(n) 和 nn 是 成 线性 关系 的 。 在 平均 情况 下 ， 假 设 每 个 位 置 都 以 相同 
的 几率 存放 查找 的 元 素 ， 那 么 大 约 查找 mw2 个 元 素 ， 因此 averageTime(n) 也 和 nn 成 线性 关系 。 

可 以 改进 时 间 代 价 吗 ? 当然 可 以 | 在 这 一 节 里 将 讲述 一 个 数组 查找 技术 ， 这 时 
worstTime(n) 及 averageTime(n) 和 n 只 是 成 对 数 关 系 。 

给 出 一 个 即将 被 查找 的 数组 和 需要 查找 的 数值 ， 然后 开发 一 个 折 半 查找 一 一 之 所 以 这 样 叫 
是 因为 在 每 一 步 上 都 把 查找 区 域 分 成 两 个 ， 直 到 查找 结束 。 一 个 重要 的 规定 是 : 

折 半 查找 的 数组 应 当 是 有 序 的 。 | 

假设 这 个 数组 的 元 素 中 已 经 定义 了 operator<。 为 了 具有 普遍 性 ， 希望 查找 已 经 定义 
operator< 的 任意 元 素 类 型 的 排序 数组 : string、int、 用 户 定义 的 类 ， 等 等 。 因 此 函数 将 元 素 
类 型 工作 为 一 个 模板 : 


template <classT> 


出 于 简单 性 上 的 考虑 ， 函 数 将 返回 true 或 false 这 依赖 于 探索 的 值 是 否 被 找到 。 实 验 11 
将 这 个 观点 延伸 到 函数 ， 该 函数 指示 探索 的 值 在 一 个 排序 数组 中 的 位 置 : 也 就 是 说 ， 在 不 破 
坏 数 组 顺序 的 前 置 条 件 下 ， 将 数值 插入 到 什么 地 方 。 尽管 实验 11 提 出 了 函数 的 授 代 版 本 (这 
是 标准 模板 库 的 典型 实现 )， 但 下 面 开发 的 函数 是 递归 的 。 

函数 共有 三 个 参数 : : 7 

1) 一 个 指针 指向 正在 搜索 区 域 的 第 一 个 位 置 。 

2) 一 个 指针 指向 正在 搜索 区 域 之 后 的 第 一 个 位 置 。 

3) 被 搜索 的 值 。 

下 面 是 完整 的 方法 接口 : 

/ 前 置 条 件 : 数组 从 头 到 尾 根据 

II 运算 符 < 排序 。 








/ 后 置 条 件 : 如 采 搜 索 的 值 出 现在 数组 的 

Il 元 素 序列 里 就 返回 真 。 否 则 ， 

// 返回 假 。 

template<class T> 

bool binary search (T* first, T* last, const T& value); 


注意 T* 被 用 作 指 针 指 向 数组 的 一 个 位 置 。 如 果 myArray 是 一 个 五 元 素数 组 ， 那 么 myArray 
是 指向 数组 第 一 个 位 置 的 指针 ， 而 myArray+5 是 指向 数组 第 五 个 位 置 后 面 的 一 个 指针 。 因 此 
binary__search 调 用 里 的 第 二 个 变 元 不 是 指向 搜索 区 域 的 最 后 一 个 位 置 ， 而 是 指向 搜索 区 域 之 
后 的 第 一 个 位 置 。 如 果 读 者 能 长 久 地 牢记 这 种 观点 ， 那 么 对 标准 模板 库 的 学 习 将 更 容易 些 。 
下 面 的 文件 中 有 一 个 main 函 数 ， 它 示范 了 标准 模板 库 中 对 binary_search 函 数 的 几 次 调用 。 
#include <iostream> 


#include <string> 
#inciude <algorithm> // 定义 binary_search 算 法 


using namespace std; 


int main( ) 


{ , 
const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


const string FOUND MESSAGE - " was found."; 

const string NOT FOUND MESSAGE = " was not found.": 
const int INT1 = 111; 

const int INT2 — 702; 

const string STRING1 = "Ken"; 

const string STRING2 = "Ed"; 

const string STRING3 = "Abe"; 

int scores [9] = {7, 22, 84, 106, 117, 200, 494, 555, 702}: 


String names [10] = {"Ada", "Ben", "Carol", "Dave", "Ed", "Frank", 
"Gerri", "Helen", "Iggy", "Joan"; 


if (binary search (scores, scores + 9, INT1)) 
cout << INT? << FOUND MESSAGE << endl: 
else 
cout << INT1 << NOT_FOUND_MESSAGE << endl: 


if (binary_search (scores, scores + 9, INT2)) 
cout << INT2 << FOUND_MESSAGE << endi: 
else | 
cout << INT2 << NOT. FOUND. MESSAGE << endi; 


if (binary search (names, names + 10, STRING1)) 
cout << STRING1 << FOUND MESSAGE << endl: 
else 
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cout << STRINGI << NOT FOUND MESSAGE << endl; 
if (binary search (names, names + 10, STRING2)) 
cout << STRING2 << FOUND_MESSAGE << endl; 


else 
cout << STRING2 << NOT FOUND MESSAGE << endl: 


if (binary_search (names, names + 10, STRING3)) 
cout << STRING3 << FOUND MESSAGE << endl; 


else 
cout << STRING3 << NOT FOUND MESSAGE << endl: 


cout << endl << endi << CLOSE WINDOW PROMPT. 
cin.get( ); 
return O; 

) // main 


程序 的 输出 是 : 


111 was not found. 
702 was found. 
Ken was not found. 
Ed was found. 
Abe was not found. 


按 下 “ 回 车 ” 键 可 以 关闭 输出 窗口 。 

递归 binary_search 算 法 的 基本 思想 是 先 找到 从 first 到 last 区 域 间 的 中 间 元 素 。 中 间 元 素 的 
值 是 *middle ，middle 的 定义 是 : 

T* middle = first + (last — first) / 2; 

这 个 赋值 语 名 右边 的 指针 运算 是 非常 与 众 不 同 的 : 两 个 指针 相 减 可 以 求 出 它们 之 间 的 
(整数 ) 距离 ， 并 且 一 个 指针 可 以 和 一 个 偏 移 量 相 加 。 

如 果 中 间 元 素 比 value (搜索 的 数值 ) 小 ， 就 从 first 的 新 值 ( 即 middle+1) 到 last 之 间 的 新 
区 域 中 执行 折 半 查找 ， 也 就 是 


if (“middle < value) | 
binary search (middle + 1, last, value); 


GM), anRvalues\F PCH, ABLAMirstBlasthy BHA ( 即 middle) 之 间 的 新 区 域 中 执 
行 折 半 查找 。 也 就 是 | 


eise if (value < *middle) 
binary search (first, middle, value); 


否则 ， 返 回 true (因为 中 间 元 素 等 于 value )。 

例如 ， 根 据 这 个 策略 ， 在 图 4-7 所 示 的 数组 names 里 搜索 “Ed”。 这 个 图 显示 了 调用 
binary_search 函 数 查 找 “Ed” 的 程序 的 状态 。 赋 值 语句 

middle = first + (last — first) / 2; 


{£79 middle#§ Ih] “Frank” 3ji, 
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names [0] *middle 
Frank 





names [1] 
names [2] value 
names [3] Ed 
names [4] 
names [5] 
names [6] 
names [7] 
names [8] 


names [9] 





图 4-7 在 调用 binary_search (names,names+10,“Ed”) 之 初 的 程序 状态 。 
这 时 将 会 从 下 标 0 到 下 标 9 之 间 查 找 “Ed” 


中 间 元 素 “Frank” 不 小 于 “Ed”, 而 “Ed” 小 于 “Frank”， 因此 执行 从 first 到 middle 之 间 
区 域 的 折 半 查找 。 调 用 是 


binary. search(first,middle,value); 


形 参 last 获 得 了 变 元 middle 的 值 。 在 binary_search 的 执行 中 ， 赋 值 语 句 
middle-first--(last- first)/2; 


令 middle 指 向 “Carol” 所 在 的 位 置 如 图 4-8 所 示 。 


| -一 names [0] *middle 


names [1] Carol 


names [2] value 
names [3] Ed 
middle names [4] 
names [5] 
names [6] 
names [7] 
names [8] 


last names [9] 





图 4-8 当 在 下 标 0 到 下 标 4 之 间 的 区 域 折 半 查找 “Ed” 之 初 的 程序 状态 


中 间 元 素 “Carol” 比 “Ed” 小 ， 因 此 从 下 标 3 (“Carol” 之 后 的 下 标 ) 到 下 标 5 (last 指 向 
的 下 标 ) 之 间 执 行 折 半 查找 。 调 用 是 


binary search(middle--1,last,value); 
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形 参 first 获 得 了 变 元 middle+1 的 值 。 在 binary_search 的 执行 中 ， 赋 值 语 名 
middleztirst- (last- first/2; 
4>middlet§ ial “Ed” MAAA, ZUWEA9. Hj! 中 间 元 素 等 于 value ， 于 是 返回 true 。 





first 
names [0] *middle 
names [1] Ed 
names [2] value 
names [3] (Ed. 
middle names [4] 
| 3H. names [5] 
names [6] 
names [7] 
names [8] 
last names [9] 


图 4-9 当 在 下 标 3 到 下 标 5 之 间 的 区 域 折 半 查找 “Ed” 之 初 的 程序 状态 


惟一 尚未 解决 的 问题 就 是 如 果 数 组 中 没有 元 素 和 value 相 等 会 怎样 ， 这 时 用 户 希 望 返回 
false。 对 任何 区 域 的 搜索 都 应 当 使 first<last， 因 此 当 first>=last 时 僻 止 搜索 . 
下 面 给 出 了 完整 的 定义 : 


template<class T> 
bool binary search (T* first, T* last, const T& value) 


{ 
if (first >= last) 
return false; 
T* middle = first + (last — first) / 2; 
if (“middle < value) 
return binary_search (middle + 1, last, value); 
else if (value < *middle) 
return binary_search (first, middle, value); 
return true; 
) // binary. search 


下 面 是 初始 调用 
binary_search(names,names+10, "Dan"); 


之 后 的 这 个 函数 的 执行 跟踪 ， 其 中 names 数 组 的 定义 和 前 面相 同 。 注 意 “Dan” 并 不 在 
names 数 组 里 。 





names = [“Ada”, "Ben", "Carol", "Dave", “Ed”, "Frank", “Gerri”, 
"Helen", “Iggy”, “Joan”] 


first = names 

last = names + 10 
value = “Dan” 
middle = names + 5 
*middle = "Frank" 


return bai cé een names + 5, “Dan”); 


names = Ada”, “Ben”, “Carol”, 。 “Dave”, “Ed”, “Frank”, “Gerri”, 
“Helen”, "Iggy", “Joan”] 


first = names 

last = names + 5 
value = “Dan” 
middle = names + 2 
*middle = “Carol” 


return binary- search pamos. + 3, names + 5, “Dan”); 
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ave”, “Ed”, “Frank”, “Gerri”, 
. *Helen', “Iggy”, “Joan”) 


first = names 

last = names + 10 
value = “Dan” 
middle = names + 5 
*middle = “Frank” 


jones binary. search (names, names + 5, “Dan”): 
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= Ada. “Ben”, ‘Carol’, “Dave”, “Eq”, "Frank", “Gerri”, 
“Helen”, "Iggy", *Joan"] 
— names + 3 
last = names + 5 
value = “Dan” 
middie = names + 4 
*middle = “Ed” 
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names = [Adar “Ben”, “Carol”, "Dave", "Ed", “Frank”, “Gerri 
“Helen”, “Iggy”, *Joan"] 


first = names 

last = names + 5 
value = "Dan" 
middle = names + 2 
*middle = “Carol” 


return pinay. sere nemeeit + Sf names + 5 S Der 
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Step 3: 


B return laris ce) (names + 3, names + 4, an ): 


ii return Ao Uh (names, names - 5, : Dany pest 
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names = [“Ada”, "Ben", "Carol", "Dave", “Ed”, “Frank”, “Gerri”, 
“Helen”, “Iggy”, “Joan” 


first = names 

last = names + 10 
value = “Dan” 
middle = names + 5 
*middle = “Frank” 


return binary_search Viames, names + 5, “Dan”); 





names — Ada”, “ “Ben”, “Carol”, “Dave”, “Ed”, “Frank”, “Gerri”, 
“Helen”, “Iggy”, *Joan"] 






first = names + 3 
last = names + 4 
value = “Dan” 
middle = names + 3 
*middle = “Dave” 









return binary_search (names + 3, names + 3, “Dan”); 


names = [“Ada”, “Ben”, "Carol", "Dave", "Ed", “Frank”, “Gerri”, 
“Helen”, “Iggy”, *Joan"] 

first = names + 3 

last = names + 5 

value = “Dan” 

middle = names + 4 

*middle = “Ed” 










names = Pada * ‘Ben’. "Carol", "Dave". "Eq. "Frank", "Geri" ; c] 
"Helen", "Iggy", “Joan”] 


first - names 

last = names + 5 
value = "Dan" 
middie = names + 2 
*middle = "Carol" 


return DAY seal pamar + 3, names + 5, Dan n); 







names = [“Ada”, “Ben”, “Carol”, ‘Dave’ "Ed", ‘Frank’, “Gerri”, 
“Helen”, "Iggy", *Joan"] - 

first - names 

last = names + 10 

value = “Dan” 

middie = names + 5 

*middle = “Frank” 
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names = [“Ada’, ‘Ben’, Carol" Dave", ‘Ed’, > "Franke, “Gerri”, 
"Helen", “Iggy”, “Joan” 


first = names + 3 
last = names + 3 
value = "Dan" 


return false; 


names = ["Ada", “Ben”, "Carol", “Dave”, "Ed", “Frank”, “Gerri”, 
"Helen", “Iggy”, "Joan"] 

first = names + 3 

last = names + 4 

value = "Dan" 

middie = names + 3 

*middle = "Dave" 


return binary search (names + 3, names + 3, "Dan"; 
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names = - Ada", "Ben", "Carol", Dave", “Ed”, “Frank”, “Gerri”, 
“Helen”, “Iggy”, Joan] | 

first = names + 3 

last = names + 5 

value = "Dan" 

middie = names + 4 

"middle 
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names = lAda", "Ben", "Carol", "Dave", "Ed, "Frank", “Gerri”, 


“Helen”, ‘Iggy’, "Joan"] 


names 
names + 5 
na "Dan" 
middle = names + 2 
"middle = "Carol _ | 


return binary search (names + 3, names + 5, "Dan; 


names - ["Ada", "Ber", "Carol", "Dave", "Ed, ","Frank' Gare: 
"Helen", "eor. mem 
first = names 1 i h 
last = names + 10 
| value = "Dan" 
| middle = names + 5 
*middle = “Frank” 


return binary search (names, names + 5, "Dan"); 





binary_search ARAE REDMI? 这 要 分 为 两 种 情况 : 找 不 到 元 素 的 失败 搜索 和 找到 
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元 素 的 成 功 搜索 。 先 开始 分 析 一 个 失败 的 搜索 。 

在 binary_search 的 执行 中 ， 假 设 中 间 元 素 不 等 于 value。 
半 。 如 果 搜 索 的 元 素 不 在 数组 里 ， 就 不 断 减 半 直 到 区 域 的 大 小 为 0。n 不 断 减 半 直 到 等 于 0 的 次 
数 是 floor(logzn)+1 ( 见 附录 1 中 的 例 A1.2)。 内 此 worstTime(n) 和 nn 是 成 对 数 关 系 的 。 人 失败 搜索 
在 平均 情况 下 对 binary_search 的 调用 次 数 也 是 相同 的 ， 因 此 averageTime(n) 也 和 n 成 对 数 关系 。 

成 功 搜索 的 最 坏 情况 下 的 调用 binary_search 的 次 数 只 比 失败 搜索 的 最 坏 (平均 ) 情况 下 的 
调用 多 一 次 。 所 以 对 一 个 成 功 的 搜索 而 言 ，worstTime(n) 和 n 是 成 对 数 关系 的 。 对 成 功 搜索 的 
平均 情况 ， 它 的 分 析 (见习 题 4.13) 更 为 复杂 些 ， 但 是 结果 是 相同 的 : 

每 次 调用 过 程 中 需要 保存 固定 数量 的 信息 : 不 是 保存 整个 数组 ， 而 只 是 一 个 指向 数组 的 
指针 。 所 以 不 论 是 成 功 搜 索 还 是 失败 搜索 ， 不 论 是 最 坏 情 况 还 是 平均 情况 ， 存 储 代价 都 和 n 成 
对 数 关 系 。 

在 实验 11 里 ， 将 看 到 binary_search 的 迭代 实现 ， 这 是 标准 模板 库 的 一 个 通用 型 算法 。 


那么 下 一 个 搜索 区 域 的 大 小 大 约 减 


averageTime(n) tf fln 


实验 11: 迭代 折 半 查找 (所 有 的 实验 都 是 可 选 的 ) 


下 一 个 例子 取 自 Eric Robert 的 深 受 欢迎 的 书 《Thinking Recursively) [I Roberts(1986)]. 


47 生成 置换 


置换 是 将 元 素 线性 排列 的 组 合 方式 。 例 如 ， 假 设 元 素 是 字母 ‘A’*、‘B’、‘C’*、 
么 可 以 得 到 下 面 24 种 置换 : 


D’, Ab 


ABCD BACD CABD DABC 
ABDC BADC CADB DACB 
ACBD BCAD © CBAD DBAC 
ACDB . BCDA CBDA DBCA 
ADBC BDAC CDAB DCAB 
ADCB BDCA CDBA DCBA 


一 般 来 说 ， 在 "个 元 素 的 情况 下 ， 置 换 中 的 第 一 个 元 素 就 有 n 个 选择 。 当 选择 完 第 一 个 元 
素 之 后 、 第 二 个 元 素 就 有 (n- 1) 种 选择 。 继 续 这 样 下 去 ， 个 元 素 的 总 的 置换 数量 就 是 


n(n — DO — 2)... QYX1) 


也 就 是 说 ，n 个 元 素 总 共有 n! 种 不 同 的 置换 ， 
从 这 个 例子 中 可 以 看 出 ， 如 果 字 符 串 s=“ABCD”， 可 以 输出 下 面 的 置换 : 
‘A’ 打头 的 六 个 置换 
B” 打 头 的 六 个 置换 
‘C” 打 头 的 第 六 个 置换 
“D” 打 头 的 第 六 个 置换 mE 
如 何 得 到 从 “A ”打头 的 六 个 置换 呢 ? 考察 上 面 的 置换 列表 将 找到 答案 。( 提示 : 6-3! ) 
观察 列表 发 现 的 关键 问题 是 ， BP CAI 打头 的 置换 中 ,在 “A， 后面 跟着 的 是 “BCD， 
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”的 不 同 的 置换 。 这 就 给 出 了 一 个 递归 的 解决 方法 。 根据 “BCD ”的 六 个 不 同 的 置换 写 出 完整 
的 s 的 字符 串 ， 于 是 就 得 到 了 “A ”打头 的 “ABCD” 的 六 种 不 同 的 置换 。 

对 接 下 来 的 六 个 置换 ， 可 以 先 交 换 'A' A B ， 那 么 s=“BACD”。 然 后 重复 前 面 的 过 
程 一 一 这 时 应 求 出 “ACD” 的 置换 ， 再 输出 s 的 每 个 置换 。 

BEPR—H EIS. BAH B’ 和 “C ， 也 就 是 s[0]#ls[2], HBAs= "CABD". HAAR 
“ABD”( 即 ，s[1...3])， 然 后 输出 s 的 每 个 置换 。 | 

最 后 六 个 置换 ， 先 交换 s[0] 和 s[3] (BI, ‘C A D’), 这 样 s=“DABC”， 然 后 在 每 次 
s[1...3] ( 即 ,“ABC”) 置换 后 输出 s。 | 
”正如 使 用 高 效 的 递归 韭 波 纳 契 函数 做 过 的 实验 9 一 样 ， 让 permute 成 为 一 个 包装 函数 。 那 
么 置换 的 每 一 层次 的 起 始 位 置 都 可 以 是 递归 函数 的 一 个 变量 。 这 个 实现 细节 隐藏 在 包装 国 数 
的 定义 中 ， 该 函数 包含 了 一 个 常量 引用 参数 s， 并 把 s 传 递 给 递归 函数 。 那 么 permute 函 数 执行 
后 原始 的 字符 串 s 将 不 会 改变 。 | | 

LAT ae B IRR: | 

WBA: 打印 输出 s 的 全 部 置换 。 


void permute (const string& s) 


{ 
rec_permute (s, 0); 
) // permute 


递归 国 数 的 函数 接口 是 : 


I ERR: 每 个 起 换 s[k...s.Ilength()- 1], 
Il 后 输出 s。 


. void rec_permute (string s, unsigned k); 


参数 k 是 unsigned (无 符号 ) 类 型 ， 这 是 因为 它 需要 和 s. iength0 比 较 ， iis length() 3B El 
类 型 是 unsigned int, 


交换 和 置换 可 以 在 一 个 for 循 环 里 完成 : 


for (unsigned i = k; i < s.length( ); i+ +) 
{ | 
swap (s [i], s [k]); // swap 是 一 个 通用 型 算法 
. rec permute (s, k + 1); 
) // for 


注意 ， 当 第 一 次 执行 循环 时 ，s[i 和 它 自身 交换 。 这 使 得 在 第 一 TARR Blik "e. (5j 
如 ， 在 置换 “ABCD” 里 ， 开 始 保留 “A” 不 变 并 置换 “BCD”。 
当 k 等 于 s.lengthO-~ 1 时 ， 递 归 调用 序列 停止 。 这 时 可 以 输出 s. 完整 的 函数 是 相当 简单 的 : 


/ IE WS TE: 每 个 置换 s[k..…s.length()-11]。 
// 后 输出 S。 
void rec_permute (string s, unsigned k) 
{ 
if (k == s.length( ) ~ 1) 
cout << s << endl; 
else 
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for (unsigned i = k; i < s.length( ); i+ +) 


swap (s [i], s [k]); / swap 是 一 个 通用 型 算法 


rec_permute (s, k + 1); 


} / for 


) // tec permute 
紧 记 s 的 值 在 递归 调用 过 程 中 是 不 会 改变 的 : s 是 rec_permute 的 一 个 值 参 。 但 是 交换 会 改 
变 s 的 值 。 例 如 ， 当 调用 
rec_permute ("BAC", 1); 
时 ， 在 这 个 调用 过 程 里 for 语 句 的 每 次 交换 调用 之 后 s 的 值 都 会 改变 。s 的 值 的 序列 是 : 


“BAC” 
“BAC” 
“BCA” 


(for 循 环 的 第 一 次 重复 之 前 ) 
(交换 s[1] 和 s[1] 之 后 ) 
(交换 s[1] 和 s[2] 之 后 ) 


W 
A 
* 


bist f sais Hipermute( “ABC” )Jq Brillfirec permute( “ABC”, 0) JRIH 


TJ HE AER E: 





k-0 
i=0 
swap s [0] with s [0] 
s is now “ABC” 
vv rec permute (“ABC”, 1); 


s = "ABC" 
k=1 
1= 1 
swap s [1] with s [1] 
s is now "ABC" 
/ rec permute ("ABC'", 2); 


s - "ABC" 
k=0 
i=0 


swap S [0] with s [0] 
s is now "ABC" i 
V rec permute ("ABC", 1); 


s = “ABC” 
k= 2 


V cout << "ABC" << endl: 


Output: 








s = "ABC" 
k=1 
i=1 











swap s [1] with s [1] 
s is now “ABC” 
rec permute (“ABC”, 2); 










"ABC" 





swap S [0] with s [0] 
S is now "ABC" 
rec permute ("ABC^, 1); 








s = "ABC" 
= 1 

i=2 

swap s [2] with s [1] 

s is now "ACB" 

V rec permute ("ACB", 2); 

















S — "ABC" 
k-0 
i-0 
swap S [0] with s [0] 
S is now "ABC" 
w rec permute (“ABC”, 1); 










Step4: | s — "ACB" 
k-2 


V cout << “ACB” << endi; ACB 


s = “ABC” 


k=1 
i-2 


swap s [2] with s [1] 
. Sis now “ACB” 
w rec permute ("ACB", 2); 





S = "ABC" 






k-0 $ 
E: 

swap s [0] with s [0] 

S is now "ABC" 







E rec permute (“ABC”, 1); 
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swap s [1] with s [0] 
s is now "BAC" 
w rec permute (“BAC”, 1); 















swap s [1] with s [1] 
s is now "BAC" 
rec permute (“BAC”, 2); 













swap s [1] with s [0] 
s is now "BAC" 












rec permute (“BAC”, 1); OMNE. 
Step 3. | = “BAC” = ü SN 
a k= 2 E E eS 
(| cout << “BAC” << endl; -BAC mate 


“BAC” 










swap s [1] with s [1] 
s is now "BAC" 
v rec permute ("BAC", 2); 






"T7 






swap s [1] with s [0] _ 
s is now "BAC" 
rec. permute (BAC 1); 








REL EEN 人 ANNE RS) Yeu De Mee LR RTE PI TE aos CN ES 


swap S [2] with s [1] 

s is now "BCA" 

rec permute (“BCA”, 2); 
SIRE MOSEN Sains foe tame REL RM ect P EROS SRI 

"ABC" 

0 


swap S [1] with s [0] 
s is now "BAC" 


OUS A co Were SA 


swap s [2] with s [1] 
s is now "BCA" 
V. Ve 


Siti semen 





eS 2258 


‘swap s [1] with s [0] 
 sisnow"BAC" . 
4 rec permute (“BAC”, 1); 


swap s [2] with s [0] 
s is now “CAB” 2 


i Pr 


swap s [1] with s [1] 
Sis now “CAB” - 
y rec permute (“CAB”, 2); _ 


prem tla dire 





a boda nr ey s 








- swap s [2] with s [0] 
s is now “CAB” 
rec permute (“CAB”, 1); 


— "CAB" 
2 


cout << “CAB” << endl; 


“CAB” 
1 
1 


swap s [1] with s [1] 
s is now “CAB” 
rec_permute ("CAB", 2); 


= “BAC” 


swap s [2] with s [0] 
s is now “CAB” 
w rec permute ("CAB", 1); 


fA 


RE T MES ETAT UR 


swap s [2] with s [1] 
s is now "CBA" 
rec permute ("CBA", 2); 


swap s [2] with s [0] 
s is now "CAB" 


(CCAB" 1) 


UALS 





ee eS ee ee ey A 


swap S [2] with s [0] 
s is now "CAB" 
rec permute (“CAB”, 1); 





估算 时 间 和 存储 需求 * 

对 时 间 需 求 ， 假 设 k: 从 0 开始 ， 并 令 n 代 表 s 的 长 度 。 然 后 for 循 环 重复 n 次 ， 也 就 是 执行 n 次 
置换 递归 调用 。 在 for 循 环 里 的 每 次 重复 中 ， 都 会 用 k=1 再 次 调用 rec_permute， 然 后 进行 
rec_permute 的 n 一 1 次 (额外 的 ) 递归 调用 。 因 此 递归 调用 次 数 之 和 是 n+n(ri-1)。 


这 个 过 程 继 续 下 去 直到 k=n-1， 这 时 打印 输出 8。 所 以 递归 调用 的 总 次 数 是 n+n(n-1)+ 
n(n—1)(n—2)+...+n(n—1)(n—2)...3+n!。 


由 于 n> 1， 所 以 这 个 累加 和 的 每 一 项 至 少 都 是 下 一 项 的 一 半 。 从 这 个 和 的 最 右边 和 次 右 
边 项 开始 ， 得 到 (参见 A1.3 中 连 乘 符号 的 解释 ): 


II; < (1/2)n! 
对 右边 的 第 二 个 和 第 三 个 元 素 ， 


II « CPTT: < 4n 
i=4 i=3 
因此 得 到 


| II: < (1/2?) n! 
公式 右边 的 指数 比 左边 的 开始 索引 小 2。 继 续 上 述 模式 ， 可 以 得 到 最 左边 项 的 公式 : 
n= II; E 11/2"7?) n 
于 是 
n n(n — 1) - n(n— D(n — 2) ++) n(n— Din — 2)++-3 + nb < 
(12^ 5n! + (2 ?)n! + - + (22)! + (1/2")n! + n! ud 
最 后 的 累加 和 小 于 2n!; 也 就 是 说 ， 递 归 调用 的 次 数 小 于 2n!， 所 以 worstTime(m) 是 O(n!)， 
并 且 这 是 最 小 值 ， 因 为 必须 输出 n! 个 置换 。 因 为 在 n>4 时 2*<n!， 所 以 任何 输出 n! 个 数值 的 函 
数 都 一 定 是 指数 级 的 函数 ， 由 此 推断 输出 n! 个 数值 是 非常 困难 的 。 | 
那么 存储 需求 如 何 呢 ? 不 论 任 何 时 候 ， 至 少 都 有 n 个 启动 的 rec_perinute。 因 为 s 是 一 个 值 


参 ，s 的 "个 字符 在 每 个 启动 中 都 保存 一 遍 ， 所 以 存储 需求 是 "的 平方 。 实 际 上 说 ， 存 储 需 求 和 
时 间 需 求 疫 什么 联系 。 例 如 ， 如 果 m=13 ， 既 只 不 过 是 169， 而 站 却 超过 了 60 亿 。 


N 
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这 个 递归 函数 的 开发 并 不 那么 容易 。 用 和 迭代 实现 更 难 ， 除 了 标准 模板 库 的 <algorithm> 文 
件 里 的 通用 型 算法 next_permutation。 迹 代 函 数 需 要 两 个 参数 并 将 返回 一 个 bool 值 ; 容 絮 类 开 
头 的 迭代 器 (或 指针 )， 以 及 容器 类 最 后 一 项 之 后 的 迭代 器 (或 指针 ) 将 被 置换 。 如 果 可 以 执 
行 任 何 一 个 置换 一 一 也 就 是 说 ， 如 果 容 器 类 尚未 违反 字母 表 顺 序 一 一 就 执行 下 一 个 置换 并 返回 
true 。 如 果 容 器 类 已 经 违反 了 字母 表 顺 序 ， 即 它 已 经 被 颠倒 ， 那 么 服从 原先 〈 前 面 ) 的 顺序 
并 返回 false 。 

注意 string 在 标准 模板 库 中 是 一 个 容器 类 ， 因 此 字符 串 对 象 定义 了 begin 和 end 方 法 。 表 4-1 
显示 了 s=“123” 时 next_permutation 的 调用 序列 ， 语 名 如 下 : 


while (next_perfnutation(s.begin(),s.end()) 
为 了 输出 s 的 全 部 置换 ，s 必 须 是 遵守 顺序 的 : ASCII 码 的 顺序 。 幸 运 的 是 ， 这 时 sort 通 用 
型 算法 出 现 了 。 下 面 是 使 用 next_permutation 的 permute 国 数 一 个 实现 | 


/ 后 置 条 件 : 答 出 的 每 个 置换 。 


void permute (string s) 


{ 
Sort (s.begin( ), s.end( )); 
cout << endl << s << endi; 
while (next permutation (s.begin( ), s. endi )) 
cout << s << endl; 
) // 图 数 Permute 


输出 了 每 个 置换 ， 共 n! 个 ， 所 以 while 循 环 执行 了 n!-1 次 。 next_permutation FR 2 fy 
worstTime(n)ze—“ i Ht, A, Stpermutefyix Pik C SEL, worstTime(n) E O(n), xE — 
个 最 小 值 。 | 

4.1 市 里 粗略 地 给 出 了 递归 函数 的 定义 ， 就 是 一 个 函数 调用 它 自身 。4.8 节 将 解释 这 个 定义 
是 不 充分 的 。 








4-1 

Wo M 前 iM 用 后 返 dq" 值 
123 | 132 | | true 
132 213 true 
213 231 | | true 
231 312 true 
312 321 true 
321 123 false 





4.8 间接 递归 


C++ 允许 函数 间接 递归 。 例如 ， 如 果 函 数 A 调 用 函数 B， 函 数 B 调 用 函数 A， 那 么 A 和 B 都 
是 递归 的 。 | 

因为 间接 递归 是 合法 的 ， 所 以 不 能 简单 地 把 递归 定义 成 一 个 函数 调用 它 自 身 。 为 了 说 明 
递归 ”的 正式 定义 ， 先 来 定义 “活化 ”。 若 一 个 函数 正 被 执行 或 是 调用 了 一 个 活动 的 函数 ， 
那么 它 就 被 称 作 是 “活化 ” 的 。 例 如 ， 考虑 下 面 的 函数 调用 链 : 
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A —— B —> C— D 


也 就 是 A 调 用 B ，B 调 用 C，C 调 用 D。 当 D 执 行 时 ， 活 化 的 国 数 是 : 

D， 因 为 它 正 被 执行 

C， 因 为 它 调用 了 D ， 而 D 是 活化 的 

B， 因 为 它 调 用 了 C ， 而 C 是 活化 的 

A， 因 为 它 调 用 了 B ， 而 B 是 活化 的 

如 果 一 个 方法 在 活化 状态 下 可 以 被 调用 ， 就 称 该 方法 是 递归 的 。 

FW ERK EL "EUH". TEVA PRB LTR IX HR ETRE POCA. Glan, BIA 
下 面 的 调用 链 : 


A—»B—»C——»D 


那么 B、C 和 D 都 是 递归 的 ， 因 为 它们 都 在 活化 状态 下 被 调用 了 。 

当 一 个 递归 国 数 被 调用 时 ， 必 须 保存 一 些 信息 ， 这 样 在 递归 调用 的 执行 过 程 中 ， 这 些 信 
蝶 不 会 被 覆盖 。 当 递归 调用 结束 后 ， 这 些 信息 将 被 恢复 。 这 种 保存 和 恢复 以 及 其 他 和 递归 执 
行 相 关 的 工作 会 耗费 一 些 执行 时 间 和 存储 空间 。4.9 节 估算 了 递归 的 代价 ， 并 推测 了 这 个 代价 
的 合理 性 。 


4.9 递归 的 代价 


. 综 上 所 述 ， 每 当 一 个 国 数 调用 它 自 身 时 都 要 保存 一 些 信息 。 这 些 信 息 全 部 都 涉及 到 一 个 
活动 记录 ， 因 为 它们 都 归属 于 当前 活化 函数 的 执行 状态 ， 实 际 上 ， 任 何 一 个 函数 被 调用 时 都 
创建 一 个 活动 记录 ; 它 可 以 在 判断 一 个 给 定 函 数 是 否 为 递归 (直接 或 间接 ) 方面 ,减轻 编译 
器 的 负担 。 

基本 上 ， 一 个 活动 记录 就 是 一 个 没有 语句 的 执行 结构 框架 。 每 个 活动 记录 包含 : 

1) 返回 地 址 ， 也 就 是 调用 结束 后 即将 被 执行 的 语句 地 址 。 

2) 每 个 值 参 、 形 参 的 值 : 对 应 变 元 的 拷贝 。 

3) 每 个 引用 形 参 的 地 址 〈7.5 节 有 一 个 示例 ， 它 是 一 个 带 有 引用 形 参 的 递归 函数 )。 

4) 函数 的 其 他 局 部 变量 的 值 。 

调用 结束 后 ， 前 一 个 活动 记录 的 信息 被 恢复 并 重新 执行 调用 的 函数 。 保 存 和 恢复 这 些 记 
杂 将 耗费 一 些 执行 时 间 代 价 ， 记 录 本 身 又 占据 空间 。 但 是 这 些 代 价 可 以 忽略 不 计 ， 因 为 编程 
者 开发 一 个 迭代 函数 将 耗费 巨大 的 精力 ， 而 递归 函数 则 是 更 容易 接受 的 。 递 归 方 法 ， 像 move 
和 rec_permute、 相 对 于 它们 的 迭代 版 本 来 说 要 简洁 优美 得 多 。 

怎样 决定 是 采用 递归 还 是 采用 迭代 呢 ? 如 果 读 者 能 轻松 地 开发 一 个 迭代 方案 ， 那 就 用 它 
"E! 如 果 不 行 ， 就 需要 考虑 递归 能 否 适用 。 也 就 是 说 ， 如 果 问 题 的 复杂 情况 可 以 简化 成 和 原 
先 形式 相同 的 简单 情况 ， 并 且 最 简单 的 情况 可 以 直接 解决 ， 那 么 应 该 试 着 使 用 递归 函数 。 

如 果 迭 代 函 数 不 容 易 开 发 ， 又 适合 用 递归 ， 那 么 递归 和 和 迭代 相 比 如 何 呢 ? 最 坏 情况 下 ， 
递归 版 本 将 会 和 迭代 版 本 有 相同 的 时 间 代 价 和 存储 代价 。 在 最 好 情况 下 ， 开 发 递归 函数 比 开 
发 迭代 函数 耗费 的 时 间 要 少 得 多 ， 而 且 时 间 和 空间 性 能 都 差不多 。 比 如 ， 这 一 章 的 move、 


CA 
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tryToSolve filrec_permute ý% 7428, Fr Aci) VA eA RUPEE GL FT BEAR ZS. RKI h fib g 
BE ARR AR. EIE RER RK (i eae EAE. 

这 一 章 中 主要 关注 于 递归 到 底 是 什么 。 后 面 的 第 7 章 里 还 将 讨论 这 个 机 制 ， 称 作 堆 栈 ， 编 
译 羡 正 是 借助 它 来 保存 和 恢复 活动 记录 的 。 正 如 在 第 3 章 中 看 到 的 ， 解 决 问题 时 ， 做 什么 和 怎 
样 去 做 还 是 有 很 大 分 别 的 。 


总 结 


IC =F 


这 一 章 的 目的 是 熟悉 递归 的 基本 思想 , 这 会 有 助 于 读者 理解 第 8 章 和 第 12 章 中 的 递归 函数 ， 
并 有 助 于 在 需要 时 设计 自己 的 递归 函数 。 

违 归 函 数 是 指 这 个 函数 在 活化 状态 下 可 以 被 调用 。 活化 函数 是 一 个 正在 执行 或 是 调用 活 
A£ Ek Br HI ER e o 

x£ Avr AA FRA FAE EERS FE far [5] RR: 

1) 问题 的 复杂 情况 可 以 简化 成 和 原先 形式 相同 的 简单 情况 。 

2) 最 简单 的 情况 可 以 直接 解决 。 

过 到 这 样 的 问题 ， 通 常 可 以 直接 开发 一 个 递归 函数 。 但 是 可 能 一 个 和 迭代 函数 一 一 由 循环 组 
成 的 一 一 将 耗费 更 少 的 时 间 和 存储 空间 。 对 某 些 问题 ， JF RIK TV ER EE UH RA E LR 
一 般 都 是 相反 的 (参阅 move、tryToSolve 和 rec_permute 函 数 )。 

无 论 何 时 ， 任 何 函 数 (递归 的 或 非 递 归 的 ) 被 调用 ， 都 将 创建 一 个 活动 记录 ， 它 提供 了 
羡 数 执行 的 参考 结构 框架 。 每 个 活动 记录 包含 : 

1) 返回 地 址 ， 也 就 是 调用 结束 后 即将 被 执行 的 语句 地 址 。 

2) 每 个 值 参 、 形 参 的 值 : 对 应 变 元 的 拷贝 。 

3) 每 个 引用 形 参 的 地 址 (需要 两 次 存储 访问 才能 访问 到 相应 的 变量 )。 

4) 函数 的 其 他 局 部 变量 的 值 。 

活动 记录 保存 了 信息 以 保证 递归 的 可 行 性 ， 如 若 不 然 ， 函数 调用 它 自身 时 将 会 破坏 这 些 
信息 。 当 前 函数 执行 结束 时 ， 将 返回 当前 活动 记录 指定 的 地 址 。 


习题 
4.1 下 面 计算 阶乘 的 函数 有 什么 错误 ? 


// WERI: n>=0, 
// ARR: 返回 nl 
long fact (int n) 


if (n == 0 || n == 1) 
return 1; 
else 
return fact (n+1) / (n+1); 
) // fact 


42 开发 wtiteBinary Be FOR 输入 一 个 非 负 十 进 制 整数 给 main 函 数 ， ladies 
3K (KwriteBinary Bar, Wik ER EO VERE. 





BEA L A 





提示 “用 一 个 While 循环 生成 位 的 值 ， 并 用 一 个 数组 保存 这 些 值 ， 然 后 是 包 金 一 个 反 
序 步 又 的 for 循 环 输 出 那些 值 。 


43 在 初始 (不 正确 的 ) 调用 move(0，'A'，'B'，'C) 之 后 ， 显 示 汉 诺 塔 move 函 数 的 执行 结 
构 框 架 跟 踪 的 前 三 步 。 

4.4 实施 执行 结构 框架 跟踪 ， 求 出 下 面 调用 的 输出 ， 它 是 rec_permute 函 数 的 错误 版 本 : 147 
rec permute ("ABC", 0); 


/ 后 置 条 件 : 每 次 进行 s[k...s-length()-1]。 
// 置换 后 输出 S。 
void rec_permute (string s, unsigned k) 
{ 
if (k == s.length( ) — 1) 
cout «« s «« endl; 
else 
for (unsigned i = k; i < s.length( ) ; i++) 
{ 
swap (s li], s [k + 1]); 
rec permute (s, k + 1); 
) // for 
) // rec, permute 


把 这 个 方法 替换 成 置换 项 目 中 的 rec_permute 方 法 ( 见 本 书 网 站 的 源 代码 ) 检测 输出 。 
4.5 实施 执行 结构 框架 跟踪 ， 求 出 初始 rec_permute("ABC", 0); 调用 后 的 rec_permnute 国 数 
错误 版 本 的 输出 : | 


ll EER: SEX XETTSIK...s.length()- 1], 
// 置换 后 输出 s。 
void rec_permute (string s, unsigned k) 
{ EE 
if (k == s.length( ) — 1) 
cout << s << endi; 
else 
for (unsigned i = k; i < s.length( ) ; i+ +) 
"d 
rec permute (S, k + 1); 
swap (s [i], s [k]); 
} // for 
) // rec. permute 


把 这 个 方法 替换 成 置换 项 目 中 的 rec_permute 方 法 ( 见 本 书 网 站 的 源 代码 ) 来 检测 输出 ， 
4.6 研究 究 <algorithm> 中 的 通用 型 算法 next_permutation。 用 简练 的 语言 描述 当 容 器 中 包含 7 
1，4，6，5，3，2 时 算法 的 工作 流程 。 
4.7 给 定 两 个 正 整 数 主 上 y， 则 它们 的 最 大 公约 数 记 作 
ged(i, j) 
它 是 满足 (i%k=0) 且 OG%k=0) 的 最 大 整数 上 。 
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例如 ，gcd(35,21)=7 而 gcd(8,15)=1。 编 制 一 个 递归 函数 返回 i 和 j 的 最 大 公约 数 ， 
检测 函数 ， 向 一 个 main 函 数 输入 两 个 正 整数 并 输出 最 大 公约 数 。 下 面 是 函数 接口 : 

// 前 置 条 件 : i>0,j>0， 

// 后 置 条 件 : 返回 i 和 j 的 最 大 公约 数 ， 

int gcd (int i, int j); 


提示 根据 欧 几 里 得 的 算法 ， 如 果 i96j=0， 那 么 i 和 j 的 最 大 公约 数 就 是 j。 否 则 ，i 和 j 的 
最 大 公约 数 就 是 j 和 (i9 有 的 最 大 公约 数 。 


4.8 回 文 是 指 这 样 的 字符 串 ， 即 不 管 从 左 向 右 或 是 从 右 向 左 都 是 相同 的 。 例 如 ， 下 面 的 字 
符 串 都 是 回 文 : 
ABADABA 
RADAR 
OTTO 
MADAMIMADAM 
EVE 


在 这 个 练习 中 规定 每 个 字符 串 都 只 是 由 大 写字 母 组 成 。( 在 习题 4.9 里 将 去 掉 这 个 限制 。) 
开发 一 个 递归 函数 测试 回 文 。 函 数 接口 是 : 


IBER 如 果 sii..j] 是 一 个 回 文 就 返回 真 。 否 则 返回 假 。 
bool isPalindrome(string s, int i, int j); 


检测 函数 : 向 main 函 数 输入 一 个 字符 串 并 判断 它 是 不 是 回 文 ， 并 输出 结果 。 


提示 。 如 果 i>=j， 则 s[i...j] 是 一 A (AREH) mx. SM, 44 Ss[i]=s[j] B. 
s[icl..j-1]2t až, s[i..j]d o m x, 


4.9 扩 展 习题 4.8 开 发 的 递归 函数 ， 使 得 在 测试 s 是 否 是 回 文 的 过 程 中 ， 可 以 忽略 不 是 字母 
的 字符 ， 并 且 不 区 分 大 小 写 。 例 如 ， 下 面 列 出 的 都 是 回 文 : 
Madam,I’m Adam. 
Able was lere I saw Elba. 
A man.A plan.A canal.Panama! 


提示 可 以 用 ctype.h 里 的 toupper 函 数 ， 将 一 个 小 写字 母 转换 成 大 写字 母 。 这 个 函数 
使 用 了 一 个 参数 : 一 个 char 类 型 的 变量 ch。 如 果 ch 在 “a”... ‘2’ SM], 那么 就 返回 
ch 的 大 写 形 式 的 ASCII 码 值 。 否 则 就 返回 ch 自身 的 ASCII 码 值 。 例 如 ， 因 为 ‘B’? 的 
ASCII 码 值 是 66， 所 以 


cout << toupper ('b') << endi 
| << (char)toupper ('b') << endl 
<< (char)toupper ('D') << endl 
<< (char)toupper (‘?') << endl: 


将 输出 
66 








ne © 


B 
D 
9 


4.10 在 第 2 章 的 Linked 类 里 ， 使 用 递归 开发 了 一 个 reversePrint 方 法 反 序 输出 一 个 Linked 对 
R. n, WR 


Linked<string> myList; 


myList.pushFront ("yes"); 
myList.pushFront ("no"); 
myList.pushFront ("maybe"); 
myList.pushFront ("but"); 
myList.reversePrint( ); 


将 输出 


yes 
no 
maybe 
but 


4.11 a. 开发 一 个 递归 函数 power， 返 回 整数 指数 的 数值 ， 接 口 如 下 
// 前 置 条件: n>=0, 
IAEF: 返回 i" 的 值 。 
long power(int i, int n); 


提示 定义 0"=1， 因 此 对 任何 整数 [，i=1。 对 任意 整数 ji 和 任 癌 的 1>0， 
i= i ("1!) 
b. 编制 power 的 迭代 实现 。 | 
c. 编制 power 的 递归 实现 ， ‘EH worstTime(n)# O(log n). 


提示 。 如 果 n 是 偶数 ， 则 power(i,n)=power(i*i,n/2); JdeXr JP RH, power(i,n)=i*i™' = 


i*power(i*i, n/2), ~ 


fEix —/ PAF, oy SI E maingR CR A Fn RA, A DL P power ER Bc. 
4.12 编写 一 个 递归 函数 ,分 析 把 一 定数 量 的 钱 变 成 两 角 五 分 的 辅币 、 一 角 硬币 、 五 分 硬 
币 和 分 币 的 不 同 变换 方法 的 数量 。 例 如 ， 如 果 有 17 分 ， 那 么 共有 6 种 转换 方式 
1 个 一 角 硬 币 、1 个 五 分 硬币 和 2 个 分 币 | 
1 个 一 角 硬 币 和 7 个 分 币 
3 个 五 分 硬币 和 2 个 分 币 
2 个 五 分 硬币 和 7 个 分 币 
1 个 五 分 硬币 和 12 个 分 币 
17 个 分 而 | 
下 面 给 出 了 函数 接口 : mE 
.— HB AK: denomination=1 (表示 分 币 ) ，2 (表示 五 分 硬币 ) 3 (表示 一 角 
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// 硬币 ) 或 4 (表示 两 角 五 分 辅币 ) 
// 后 置 条 件 : 如 果 amount<0， 那 就 返回 0。 否 则 ， 返 回 这 些 钱 换 成 硬币 的 不 同 变换 
// 方法 的 数量 


int ways(int amount, int denomination); 

为 了 简化 ways 函 数 ， 使 用 一 个 coins 函 数 返 回 每 个 硬币 的 币值 。 因 此 ，coins(1) 返 
回 1，coins(2) 返 问 5，coins(3) 返 回 10，coins(4) 返 回 25。 

测试 ways 和 coins 国 数 : 输入 一 个 钱 数 ， 再 输出 将 它 变 成 两 角 五 分 的 辅币 、 一 角 
硬币 、 五 分 硬币 和 分 币 的 不 同 变换 方法 的 数量 。 


提示 “将 amount 换 成 不 大 于 两 角 五 分 辅币 的 变 摘 方法 的 数量 等 于 将 amount- 25 ERK 
不 大 于 两 角 五 分 辅币 的 方法 数 ， 加 上 将 amount 变 换 成 不 大 于 一 角 硬 币 的 方法 数 。 


4.13 证 明 : 递归 binary_search 函 数 在 查找 成 功 的 情况 下 ， averageTime(n) 和 nn 是 成 对 数 关 
HJ. 


提示 令 n 代 表 将 搜索 的 数组 的 长 度 。 因 为 平均 调用 次 数 是 4 的 非 递减 函数 ， 所 以 只 要 
证 明 对 等 于 2 的 辕 的 1 论证 结论 为 真 ， 那 么 小 于 它 的 也 同样 成 立 。 因 此 假设 : 
对 某 正 整数 FE，m=25: 
在 一 个 成 功 的 查找 中 ， | 
如 来 查找 的 元 素 在 搜索 区 域 的 中 间 ， 调 用 一 次 就 结束 。 
如 玉 查 找 的 元 素 在 搜索 区 域 的 四 分 之 一 或 四 分 之 三 处 ， 调 用 两 次 结束 。 
如 采 查 找 的 元 素 在 搜索 区 域 的 八 分 之 一 、 八 分 之 三 、 八 分 之 五 或 八 分 之 七 处 
调用 三 次 结束 。 
依次 类 推 。 
所 有 成 功 查找 的 调用 总 数 是 : 
(1-1) € (2-2) + (3-4) 4 (4-8) 4 (5-16) +--+ + (k- 2*1) 
平均 调用 次 数 以 及 averageTime(n) 可 以 估算 为 这 个 和 除 以 x。 现在 使 用 习题 A1.3 
的 结果 和 前 提 k=log,(n+1) 可 以 论证 。 
4.14 怎样 修改 递归 binary_search 函 数 ， 可 以 使 它 在 每 次 调用 中 只 做 一 次 比较 ? 
提示 见 实验 11。 


4.15 修改 Maze 应 用 ， 使 得 终端 用 户 可 以 输入 一 个 文件 名 保存 迷宫 。 
4.16 修改 Maze 应 用 ， 使 它 允 许 斜 向 移动 。 
4.17 利用 数学 归纳 法 原理 (附录 1)， 证 明 汉 诺 塔 范例 中 的 move 函 数 是 正确 的 。 


SER  *n-123,., 45,9» i&é move(n ,Orig,dest,temp)， 输 出 n 个 盘子 从 任意 的 杆 orig 
移动 到 另 一 根 杆 dest 上 的 步骤 。 


a. 基本 情况 。 证 明 S, 为 真 。 
b. 归纳 分 析 。 令 n 是 大 于 1 的 整数 并 假设 5, ,为 真 。 然 后 证 明 5, 为 真 。 根 据 move 函 数 的 
代码 ， 调 用 move(n,orig,dest,temp) 时 会 发 生 什 么 ? 
4.18 汉 诺 塔 应 用 的 move 函 数 的 执行 跟踪 中 ， 步 骤 数 等 于 move 递 归 调 用 次 数 加 上 输出 语 
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句 的 数量 。 因 为 每 次 调用 move( 包 含 了 n=1 时 的 调用 ) 都 有 一 个 输出 语句 ， 所 以 move 
递归 调用 的 次 数 总 是 比 输出 语 名 数 少 1 ， 而 和 输出 语句 的 数量 是 2"- 1。 例 如 ， 在 本 竟 
所 示 的 执行 跟踪 里 ，n=3， 所 以 步骤 数 是 6+7 (回忆 一 下 ， 从 第 0 步 开 始 ， 最 后 是 第 
12 步 )。 当 n=4 时 ， 执 行 跟踪 共有 多 少 步 昵 ?通常 情况 下 ， 步 骤 数 是 n 的 函数 ， 那 么 
akg? {153 


编程 项 目 4.1: 汉 诺 塔 的 和 迭代 版 本 


编制 汉 诺 塔 游戏 中 move 国 数 的 友 代 实现 。 输 入 盘子 数量 到 main 函 数 ， 然 后 调用 move 国 数 ， 
测试 该 方法 。 
提示 ”如果 能 回答 下 面 的 三 个 问题 ， 就 可 以 得 到 每 一 步 上 正确 的 移动 : 


1) 即将 移动 哪个 盘子 ? 为 了 回答 这 个 问题 ， 设 立 一 个 mn 位 的 计数 器 。 令 "是 盘子 的 数量 ， 
并 将 计数 器 全 部 清 零 。 例 如 ， 如 果 n=5， 就 从 00000 开 始 。 

每 一 位 对 应 一 个 盘子 : 最 右边 的 位 对 应 盘 1， 次 右边 的 位 对 应 盘 2， 依 次 类 推 。 在 每 一 步 
中 ,移动 最 右边 的 0 位 对 应 的 盘子 ， 因 此 第 一 个 移动 的 盘子 应 当 是 盘 1. 

移动 一 个 盘子 之 后 ， 应 按 如 下 方式 增加 计数 : 自 碳 向 左 反 转 位 (0 变 成 1，1 变 成 0) ， 直 到 
遇 到 一 个 0。 例 如 ， 前 几 次 增加 计数 和 移动 如 下 : 

00000// 移 动 盘 1 

00001// 移 动 盘 2 

00010// 移 动 盘 1 

00011// 移 动 盘 3 

00100// 移 动 盘 1 

00101//f£ z]j t2 | 

在 做 了 31 次 移动 之 后 ， 计 数 器 全 部 位 都 是 1， 因 此 不 再 需要 也 不 可 能 做 任何 移动 。 通 常 需 
要 2"' 次 移动 和 计数 。 | 154 

2) 盘子 将 向 哪儿 移动 ? 如 果 n 是 奇数 ， 就 将 奇数 号 的 盘子 按 顺 时 针 移 动 : 


A—B——c 


而 将 偶数 号 的 盘子 按 逆 时 针 移 动 : 


A 4— B «— C 


Anne Br, RAR SR TM EF ER zb. TR SHA Fee ER. 
如 朵 用 0、1、2 取 代 杆 的 编号 A、B、C， 那 么 可 以 很 容易 地 用 模 运算 实现 移动 。 也 就 是 ， 
如 有 果 当 前 位 置 是 村 5， 那 么 
k = (k+1)%3 
实现 了 一 个 顺 时 针 移动 ， 而 
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k=(k+2)%3 
实现 了 一 个 逆 时 针 移 动 。 输 出 时 再 将 它 转 换 回 字符 : 
cout<<char(k+'A’); 
3) 现在 豆子 在 哪里 ? 跟踪 盘 1 的 去 向 。 如 果 计 数 器 指示 盘 1 即 将 被 移动 ， 就 用 问题 2 的 答 
案 来 移动 盘子 。 如 果 计 数 器 指示 即将 移动 的 盘子 不 是 盘 1， 那 么 问题 2 的 答案 将 解答 盘子 的 当 
前 位 置 。 为 什么 会 这 样 ? 因为 这 个 盘子 不 能 移动 到 盘 1 的 上 面 并 且 现 在 不 能 从 盘 1 所 在 的 杆 上 
移 走 。 


编程 项 目 4.2: 八 皇 后 问题 


将 八 个 皇后 放 在 棋盘 上 ， 并 保证 每 个 皇后 都 不 会 被 其 他 皇后 攻击 到 ， 编 写 并 验证 这 个 
程序 。 

分 析 : 

棋盘 有 八 行 八 列 。 在 象棋 游戏 里 ， 皇 后 是 功能 最 强 的 : 她 可 以 攻击 和 她 同行 、 和 她 同 列 
或 者 在 她 的 对 角 线 上 的 任何 棋子 。 见 图 4-10。 





图 4-10 象棋 中 可 以 被 皇后 攻击 到 的 位 置 。 箭 头 指示 了 
棋盘 中 心 的 皇后 (Q) 可 以 攻击 到 的 位 置 


这 个 问题 不 需要 输入 。 输 出 是 放置 好 八 个 皇后 之 后 的 棋盘 状态 。 例 如 : 


0 1 2 3 4 5 6 7 
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全 -一 


输出 时 不 需要 显示 线条 。 


提示 。 每 一 行 、 每 一 列 都 应 恰好 有 一 个 皇后 。 从 (0，0) 开始 放置 一 个 皇后 OF 
0 行 第 0 列 ; 然后 在 每 列 上 放置 一 个 皇后 。 一 个 有 效 的 位 置 应 当 和 前 面 放置 的 皇后 不 
在 同行 、 同 列 或 同一 对 角 线 上 。QueensIterator 构 造 器 将 前 进 到 第 0 行 的 下 一 列 上 。 
operator++ (int) 将 前 进 到 同一 列 的 下 一 行 。 因 此 第 一 次 调用 tryToSolve 时 ， 选 
择 是 : 


(0, 1) /无 效 : 和 (0, 0) 处 的 皇后 在 同一 行 

(1, 1) /无 效 : 和 (0, 0) 处 的 皇后 在 同一 对 角 线 
(2, 1) /有 效 

再 次 调用 tryToSolve 时 ， 选 择 是 : 

(0, 2) /无 效 : 和 “(0，0) 处 的 皇后 在 同一 行 

(1, 2) /无 效 : 和 (2, 1) 处 的 皇后 在 同一 对 角 线 
(2, 2) // 无 效 : 和 -(2，1) 处 的 皇后 在 同一 行 

(3, 2) // 无 效 : 和 (2, 1) 处 的 皇后 在 同一 对 角 线 
(4, 2) /有 效 


编程 项 目 4.3: 马 的 遍历 问题 


编写 程序 实现 马 对 棋盘 的 遍历 ， 并 验证 该 程序 。 

分 析 | eek | 

一 个 棋盘 有 八 行 八 列 。 从 当前 位 置 出 发 ， 一 个 马 的 移动 必须 跨越 两 行 一 列 或 是 两 列 一 行 。 
例如 ， 图 4-11 显 示 了 (5，3) 位 置 上 ( 即 第 5 行 第 3 列 ) 的 马 的 所 有 的 合法 移动 。 


站 等 = 
Oh Pp 





图 4-11 对 坐标 , (5，3) ,上 的 马 而 言 ， 合 法 的 移动 就 是 K0 到 K7 标 记 的 位 置 
简化 一 下 问题 ， 假 定 马 从 (0, 0) 开始 移动 。 接 照 顺序 尝试 图 4-11 所 示 的 全 部 移动 。 也 
就 是 从 位 置 ( 行 ， 列 ) 出 发 ， 依 次 尝试 : 


(row—2,column+1) 
(row—1,column+2) 
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(row+1 ,column+2 ) 
(row+2,column+1 ) 

(row+2,column- 1) 

(row-l,column-2) . 

(row- 1,column-2) à ; 
(row-2,column- 1 ) 


158 图 4-12 显 示 了 前 几 个 移动 。 





图 4-12 马 从 坐标 (0，0) 开始 的 前 几 个 以 及 重复 图 4.11 所 示 
— 顺序 的 有 效 移动 。 方 框 里 的 整数 代表 移动 的 次 序 


14-1288. (0, 0) 开始 的 9 个 移动 都 没有 发 生 回溯， 实际 上 前 36 次 移动 都 不 需要 回溯 。 
所 时 发 生 回 溯 的 次 数 是 非常 惊人 的 : 超过 300 万 。 根 据 这 种 顺序 ， 迁 代 得 到 的 答案 是 





生意 第 37 次 移动 ， 位 置 (1，3) 没有 选择 第 一 种 移动 方式 -到 位 置 (3，2)， 也 没有 选择 
第 一 种 * 这 两 个 选择 都 通 向 死胡同 。 将 发 生 回溯 。 第 三 种 选择 到 (0，1 ) ， 是 正确 的 
i A Vers 
系统 测试 1 线条 是 不 需要 输出 的 。 请 输入 开始 的 行 和 列 : 


0 0 
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答案 是 : 





获得 这 个 答案 需要 1100 万 次 回调 。 从 某 些 位 置 出 发 ， 比 如 (0，1 ) ， 需 要 超过 600 万 次 的 
回溯 .但 从 任意 一 个 位 置 出 发 ， 都 可 以 找到 答案 ; 参阅 
http://www.wealth4freedom.com/WORLDNEWSSTAND/knightstour.htm 
尽管 看 起 来 几乎 是 立刻 得 到 了 答案 ， 但 这 也 并 不 表示 解答 过 程 是 没有 回溯 的 。 对 每 个 起 
始 位 置 而 言 ， 通 过 回调 获得 的 解答 都 保存 在 一 个 文件 里 。 
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本 章 将 开始 标准 模板 库 的 数据 结构 的 学 习 。 正 如 在 第 2 章 中 提出 的 ， 标 准 模板 库 中 提供 的 
每 个 数据 结构 都 是 某 些 容器 类 的 方法 接口 的 集合 。 和 用 户 的 观点 相 适 应 的 是 ， 标 准 模板 库 没 
有 指定 任何 实现 细节 ; 5$.2.3 放 和 5.4.1 节 中 将 考虑 可 能 的 实现 。 

在 顺序 容器 中 ， 元 素 从 第 1 个 到 最 后 一 个 是 连续 存储 的 。 

这 里 介绍 的 容器 类 有 vector 和 deque 类 。 这 些 类 以 及 第 6 章 中 的 list 类 称 作 顺序 容器 类 。 在 
顺序 对 象 中 ， 可 以 将 项 看 作 是 从 第 1 个 到 最 后 一 个 连续 存储 的 。 例 如 ， 一 个 顺序 对 象 Pets 可 能 
有 按 如 下 方式 安排 的 项 : “dog”, “cat”, “iguana”, “gerbil”, iX H "dog" BA-M, WA 
“gerbil” 是 最 后 一 项 。 在 这 个 例子 中 ， 项 不 是 按照 字母 顺序 排序 的 。 | 

向 量 是 一 维 数 组 的 类 版 本 。 和 数组 相似 ， 向 量 中 的 项 是 连续 存储 的 。 但 是 和 数组 不 同 的 
是 ， 疝 量 的 大 小 是 在 程序 运行 过 程 中 根据 需要 自动 增加 的 。 在 了 解 向 量 的 简便 和 强大 功能 后 ， 
用 户 可 能 再 也 不 会 为 数组 费心 了 ! 双 端 队列 也 和 数组 相似 ， 它 允许 常数 时 间 内 对 任意 项 的 随 
机 访问 。 但 是 从 双 端 队列 的 前 面 进行 桂 入 或 删除 时 ，averageTime(n) 是 常数 ， 而 在 数组 或 向 量 
里 是 和 7 成 线性 关系 的 。 本 章 中 讲述 的 向 量 和 双 端 队列 的 应 用 是 在 公 钥 加 窗 算 法 领域 。 


目标 


1) 理解 标准 模板 库 的 主要 组 件 之 间 的 关系 : 容器 类 ， 和 迭代 器 和 通用 型 算法 。 
2) 比较 用 户 和 开发 者 对 vector 类 以 及 deque 类 的 看 法 。 

3) 能 够 判断 什么 时 候 使 用 向 量 或 双 端 队列 更 好 ， 什 么 时 候 使 用 数组 更 好 。 
4) 比较 用 户 和 开发 者 对 VeryLongInt 类 的 观点 。 | 


5.1 标准 模板 库 


面向 对 象 编程 的 一 个 主要 目标 是 代码 的 重用 ， 例 如 通过 继承 。 一 般 来 说 ， 人 们 更 愿意 使 
用 已 经 开发 好 的 类 而 不 是 白手 起 家 开发 一 个 项 目 。 在 容器 类 中 有 一 个 特殊 情况 ， 即 验证 过 的 
库 、 高 效率 的 容器 类 可 以 显著 降低 项 目 开 发 时 间 。 标 准 模板 库 (Stepanov and Lee,1994) 正 是 
提供 了 一 个 这 样 的 库 。 标 准 模板 库 的 三 个 主要 的 组 件 是 : 

1) 模板 容器 类 的 集合 。 | 

2) 通用 型 算法 ， 也 就 是 模板 函数 的 集合 。 

3) 迭代 器 种 类 也 就 是 系列 迭代 器 类 的 集合 。 

在 标准 模板 库 中 ， 通 用 型 算法 通过 迄 代 器 操作 容器 。 | 

正如 在 实验 7 中 所 看 到 的 ， 通 用 型 算法 通过 迭代 器 操作 容器 。 例 如 ， 通 用 型 算法 find 在 容 
器 中 搜索 一 个 给 定 项 。 但 是 这 个 搜索 并 不 基于 任何 容器 类 自身 的 具体 细节 ， 因 为 如 果 那 样 ， 
find 的 使 用 就 被 局 限 在 这 个 容器 类 中 了 。 而 且 ， 在 另 一 个 代码 重用 的 范例 中 ， 任 何 关联 迭代 器 
类 属于 InputIterator 类 的 容器 中 都 可 以 使 用 find 算 法 搜索 。 实 际 上 ， 和 迭代 器 从 它 的 容器 中 抽象 
出 访问 该 容器 所 有 项 时 所 必需 的 信息 。  ” 
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这 里 没有 任何 对 标准 模板 库 实 现 的 规定 。 

标准 模板 库 是 美国 国家 标准 化 组 织 认 可 的 官方 C++ 语言 的 一 部 分 。 但 这 只 意味 着 规定 了 方 
法 和 国 数 的 接口 。 这 里 没有 任何 对 标准 模板 库 实 现 的 规定 : 只 要 满足 接口 ， 开 发 者 可 以 日 由 
地 以 任何 方式 实现 类 和 通用 型 算法 。 在 惠普 研究 实验 室 中 由 Stepanov、Lee 和 其 他 人 开发 的 原 
始 实现 是 现今 所 用 的 很 多 实现 的 基础 : Microsoft 的 Visual C++、Inprise 的 C++Builder 和 
Metrowork 的 CodeWarrior 等 。 下 面 将 学 习 该 原始 实现 ， 另 外 还 提出 了 另 一 个 可 行 的 实现 。 

即将 学 习 到 的 标准 模板 库 中 的 第 一 个 容器 类 是 vector 类 ， 它 基本 上 就 是 数组 的 类 版 本 。 首 
先 定义 向 量 是 什么 ， 观 察 少许 数量 众多 的 vector 方 法 的 接口 ， 并 对 比 向 量 和 数组 ， 然 后 给 出 
vector 类 的 标准 实现 的 概观 ， 最 后 开发 一 个 使 用 向 量 的 应 用 。 对 deque 类 也 采用 相同 的 方法 。 


5.2 [mE 


问 量 是 一 个 项 的 有 限 序 列 ， 满 足 : 

1) 给 出 序列 中 任何 项 的 下 标 ， 就 可 以 在 常数 时 间 内 访问 或 修改 该 下 标 对 应 的 项 。 

2) 在 序列 尾部 进行 的 插入 平均 说 来 只 耗费 常数 时 间 ， 但 是 worstTime() 是 O(n)， 其 中 nn 代 
表 序列 中 项 的 数量 。 | 

3) 对 序列 尾部 进行 的 删除 ，worstTime(n) 是 常数 。 

4) 对 任意 的 插入 和 删除 ， worstTime(n) 和 averageTime(n) 都 是 O(n)。 

vector 类 以 及 标准 模板 库 中 其 他 所 有 的 类 都 是 模板 化 的 。 也 就 是 说 ， 项 的 类 型 可 以 是 一 个 
基本 类 型 ， 比 如 int 或 double; 也 可 以 是 一 个 类 ， 如 string 类 或 第 1 章 中 介绍 的 Employee 类 。 例 
如 ， 可 以 按 如 下 方式 定义 字符 串 的 一 个 空间 量 : 


vector<string>fruits; 


在 向 量 中 允许 重复 项 。 因 此 ， 如 果 把 “oranges”、“apples”、“grapes” 和 “apples” 插 入 
fruits, PAM BHAA SIM. 项 “oranges” 位 于 下 标 0 处 ,，“appies” 位 于 下 标 1 处 ， 
grapes” 位 于 下 标 2 处 ,，“apples” 位 于 下 标 3 处 。 这 些 项 不 是 按照 字母 顺序 排序 的 。 实 际 上 ， 
一 个 向 量 中 的 项 不 一 定 是 可 以 比较 的 。 例 如 ， 假 设 向 量 是 一 个 文本 ， 即 行 序列 ;那么 称 一 行 
小 于 ” 另 一 行 是 没有 意义 的 。 当 然 ， 仍 然 可 以 比较 行 的 下 标 ， 并 称 当前 行 的 下 标 小 于 其 他 蘑 
些 行 的 下 标 。 | 

vector 类 有 两 个 模板 参数 : 


template<class T class Allocator=allocator> 


模板 参数 T 代 表 项 的 类 型 。Allocator 参 数 涉及 了 内 存 分 配 模型 (例如 ， 一 个 指向 T 的 指针 
是 否 缺 省 地 定义 成 T*， 或 定义 成 特殊 些 的 ， 像 T_far*)。 处 理 多 种 分 配 模型 所 需要 的 灵活 性 是 
很 多 标准 模板 库 实现 比较 复杂 的 根源 。 为 简单 起 见 ， 采 取 allocator 类 给 出 并 在 <defalloc> 中 定 
义 的 缺 省 分 配 模型 。 根 据 参 考 标 准 (Musser and Saini, 1996, p.274) 中 的 建议 ， 我 们 “省 略 
Allocator 参 数 的 进一步 探讨 "。 实 际 上 ， 


今后 ， 所 有 的 声明 和 定义 者 将 采取 缺 省 分 配 模型 。 


5.2.1 节 从 用 户 的 角度 开始 vector 类 的 设计 ， 即 方法 接口 的 设计 。 在 vector 类 中 有 50 多 个 方 
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法 ， 因 此 应 该 集中 精力 处 理 在 应 用 中 最 有 可 能 用 到 的 方法 。 方 法 接口 并 不 包括 任何 具体 的 字 
段 或 方法 定义 。 这 种 分 离 是 数据 抽象 的 基本 原理 . 

每 个 方法 的 时 间 需 要 用 大 0 表示 法 指定 ， 因 为 只 需要 确定 一 个 上 界 : 方法 的 特定 实现 可 能 
降低 这 个 上 界 。 如 末 没 有 给 出 方法 的 时 间 估 算 ， 可 以 假设 worstTime(n) 是 常数 ， 其 中 n 代 表 向 
量 中 项 的 数量 。 如 采 方 法 的 平均 时 间 花 费 估算 和 最 坏 时 间 花 费 估 算 相同 ， 就 只 给 出 最 坏 时 间 
估算 。 


5.2.1 vector 类 的 方法 接口 


下 面 列 出 了 vector 中 少数 几 个 最 常用 方法 (参见 表 5-1) 的 接口 。 
表 5-1 一 些 vector 方 法 的 简单 描述 (假定 定义 为 : vector<double>::iterator itr;) 








J ik 功 能 

vector<double>weights weights 是 一 个 空 的 向 量 — 

weights.push_back(107.2) 在 向 量 weights 的 尾部 插 人 107.2 

weights insert(itr,1 25.0) 在 itr 所 在 位 置 插入 125.0; weights 中 插入 点 之 后 的 项 依次 向 后 移动 - :个 位 
置 ; 返回 一 个 位 于 新 插入 项 上 的 迭代 器 

weights.pop. back() 删除 weights 中 昆 部 的 项 

weights.erase(itr) | 删除 itr 所 在 位 置 上 的 项 ; 高 位 的 项 依次 向 前 移动 ; ADRESSES SES 
面 位 置 的 迭代 器 失效 

weights.size() 返回 weights 中 项 的 数量 

weights.empty() 如 采 weights 中 没有 项 就 返 同 真 ;否则 返回 假 

weights[3]=110.5 将 weights 中 下 标 3 处 的 项 替换 成 110.5 

itr=weights.begin() itr & -Fweights 3L 3j fr) [zz Be 

itr==weights.end() RUFRite tS KF fie T weights ke Ja — Hi 7 Jc; sk 3s [Al 真 ERNE EHE 

weights.front()2105.0 weights) F FROMM IM SEM rk 105.0 


\ 


1. /后 置 条 件 : 这 个 向 量 为 空 ， 也 就 是 说 ， 它 当中 不 包含 任何 项 。 


vector(); | 
fi 下 面 是 创建 空 的 fruits 向 量 的 定义 以 及 测试 数据 : 


vector«string»fruits; 
vector<Employee>employees; 
vector«int»scores; 


注意 这 也 是 一 一 个 构造 器 ， 称 作 拷贝 构造 器 ， 所 背 一 个 向 年 初始 化 成 其 他 向 重 的 拷贝 。 
方法 头 是 : 


vector(const vector<T>& x); 

例如 ， 如 果 已 经 在 示例 中 构造 了 向 量 fruits ， 可 以 编写 : 
vector<string>newFruits(fruits); 

那么 就 定义 了 newFruits， 同 时 把 它 也 初始 化 成 了 fruits 的 拷贝 。 


2. /后 是 条 件 : 在 这 个 向 量 的 尾部 插入 x 的 拷贝 。averageTime(m) 是 常数 ， worstTime(n)#O(n) , 
// 但 是 对 n 次 连续 的 push_back 调 用 ，worstTime(n) 只 是 O(n)， 
void push_back(const T& x); 
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例 下 面 是 创建 四 个 项 的 向 量 的 代码 : 
vector<string> fruits; 


fruits.push_back("oranges"); 
fruits.push, back("apples"); 
fruits.push, back("grapes"); 


fruits.push back("apples"); 


回 量 fruits 现 在 包含 了 下 列 顺序 的 项 : 


“oranges”, “apples”, “grapes”, “apples” 


注意 ”接口 没有 规定 任何 实现 细节 。 在 一 个 有 代表 性 的 实现 中 ， 第 一 次 调用 

push_back 时 为 向 量 分 配 一 个 存储 块 ( 上 比如 ，1K 字 节 )。 随 后 的 插入 将 填 满 存储 向 量 

的 这 个 块 。 如 果 存 储 块 已 满 不 能 进行 插入 ， 就 重新 分 配 ， 并 将 整个 向 量 找 贝 到 大 小 

是 当前 块 两 倍 的 新 块 中 。 那 么 指向 前 面 块 的 所 有 的 迭代 器 和 引用 就 都 失效 了 ， 

3. // 前 置 条 件 : 迭代 器 位 于 向 量 头 和 向 量 尾 后 的 下 一 个 位 置 之 间 ， 
// 后 置 条 件 : x 的 拷贝 放 入 迭代 器 位 置 所 在 的 位 置 。 调 用 前 ， 每 个 大 于 等 于 该 位 置 下 标的 位 置 
i RBH. BEF RA TH ALE AALS, worstTime(n) O(n), 
iterator insert(iterator position, const T& x); 

例 假设 fruits 是 push_back 示 例 中 的 向 量 ， 它 有 如 下 顺序 的 项 : 

“oranges”, “apples”, “grapes”, “apples” 

如 采 选 代 器 itr 位 于 下 标 2 的 “grapes” 项 的 位 置 上 ， 那 么 

vector<string>::iterator new_itr=fruits.insert(itr,"kiwi"); 

将 使 fruits 变 成 

“oranges”, “apples”, “kiwi”, “grapes”, “apples” 


并 且 进 代 器 new_itr 位 于 下 标 2 的 “kiwi” 项 的 位 置 上 。itr 失 效 ; 也 就 是 说 ， 不 能 确认 itr 的 


位 置 ， 甚 至 不 能 确认 itr 是 否 还 在 fruits 中 其 项 的 位 置 上 。 


注意 1 如 果 一 个 插入 导致 重新 分 配 (参见 push_back 方 法 的 注意 )， 旧 的 近代 器 和 引 
用 都 将 失 殖 。 如 果 不 发 生 重新 分 配 ， 那 么 只 有 插入 点 上 及 之 后 的 迁 代 器 和 引用 失效 。 


注意 2 push backZr ik X insert& 44 45] , 


4. /前 置 条 件 : 向 量 非 空 。 
Ie SETS 这 次 调用 前 向 量 尾 部 的 项 被 删除 。 
void pop_back(); 


例 假设 fruits 是 insert 方 法 示例 中 的 向 量 ， 它 有 如 下 顺序 的 项 : 
“oranges”, “apples”, “kiwi”, “grapes”, “ apples” | 

AUR THES Ji 

fruits.pop. back(); - 


那么 fruits 将 有 下 列 顺 序 的 项 : 
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"oranges", "apples", "kiwi", "grapes" 


5. // 前 置 条 件 : 迭代 器 位 置 位 于 向 量 中 某 一 项 的 位 置 上 。 
// 后 置 条 件 : 这 次 调用 前 位 于 迭代 器 位 置 上 的 项 被 币 除 。 调 用 前 每 个 下 标 大 于 迭代 器 位 置 
Mt 下 标的 项 依次 向 前 移动 。worstTime(n) 是 O(n)。 

void erase(iterator position); 


fj 假设 fruits 是 pop_back 方 法 示例 中 的 向 量 ， 它 有 如 下 顺序 的 项 : 
"oranges", “apples”, “kiwi”, “grapes” 
如 果 迹 代 器 itr 位 于 项 “apples” 的 位 置 上 并 生发 送 消 息 
fruits.erase(itr); . 

那么 fruits 将 包含 下 列 顺序 的 项 : 


"oranges", "kiwi", “grapes” 
注意 1 erase 方 法 使 掠 除 点 之 后 的 所 有 和 迭代 器 和 引用 都 失效 。 
注意 2 pop backz ikXerase$j 44 4p], 


注意 3 AEA—eraseFAkHMA, CHAAR BKRKR—firstfolast, HAL 
first (包括 first) felast (不 包括 last) ZAHARRER., Hic, Mik fruits E A Je F 
顺序 项 的 向 量 : \ 
“oranges”, “apples”, “kiwi”, “grapes” 
如 果 和 迭代 器 itrl1 位 于 项 “apples” 位 置 上 ，itr2 位 于 项 “grapes” 位 置 上 ， 并 发 送 消 息 
fruits.erase(itr1 ,itr2); 
那么 fruits 将 包含 如 下 顺序 的 项 : 
“oranges”, “grapes” 
项 “grapes” 未 被 擦 除 ， 这 是 因为 erase 调 用 中 的 第 二 个 变 元 itr2 是 即将 被 擦 除 的 最 后 一 项 
之 后 的 项 。 这 个 erase 方 法 的 时 间 代价 和 向 量 中 last 之 后 的 项 的 数量 成 正比 ， 因 为 那些 都 是 必须 
移动 的 项 。 


6. // I MESES 返回 向 最 中 项 的 数量 
unsigned size() const; 


例 假设 fruits 是 有 如 下 顺序 项 的 向 量 : 
“oranges”, “kiwi”, “grapes” 
如 果 有 

cout««truits.size(); 


那么 输出 将 是 
3 





132 





w 
» 
* 


注意 1 在 ANSI 标 准 C++ 中 ， 返 回 类 型 是 Size_type。 在 Stddef.h 中 有 


typedef unsigned size_t; 

Bola, saa Ac ae 

typedef size t size type; 

因此 返回 类 型 是 unsigned。 

注意 2 为 了 求 出 在 重新 分 配 发 生前 可 以 插入 多 少 项 ， 配 合 使 用 size 方 法 和 capacity 方 
法 。capacity 方 法 的 接口 在 编程 项 目 5.2 中 给 出 了 ， 它 返回 重新 分 配 发 生前 向 量 中 可 以 
存储 的 项 的 数量 。 例 如 ， 如 果 vec 是 一 个 向 量 对 象 ， 

cout««vec.capacity()- vec.size(); 

将 输出 重新 分 配 发 生 之 前 还 可 以 播 和 人 的 项 的 数量 。 


7. I RES ME: 如 果 这 个 向 量 中 不 包含 任何 项 就 返回 真 。 否 则 ， 返 回 假 。 
bool empty() const; 


例 假设 fruits 是 有 如 下 顺序 项 的 向 量 : 
“oranges”, “kiwi”, “grapes” 
如 果 有 


while(!fruits.empty()) 
fruits.pop_back(); 


人 循环 将 执行 3 次 ， 然 后 fruits 为 空 。 
8. // 前 置 条 件 : 0<=n< 向 量 中 项 的 数量 。 


// 后 置 条 件 : 返回 对 向 量 的 从 开头 算 起 的 第 n 项 的 引用 。 
T& operator(](unsigned n); 


例 1 假设 fruits 是 有 如 下 顺序 项 的 向 量 : 
“oranges”, “kiwi”, “grapes” 
如 果 有 


cout<<fruits[1]; 


那么 输出 将 是 


kiwi 
例 2 假设 fruits 是 有 如 下 顺序 项 的 向 量 : 


“oranges”, “kiwi”, “grapes” 


如 果 有 
fruits[1]="limes"; 
那么 fruits 将 包含 如 下 顺序 的 项 : 


“oranges”, “limes”, “grapes” 


例 3 可 以 使 用 下 标 运 算 符 迭代 通过 一 个 向 量 。 例 如 ， 假 设 fruits 是 有 如 下 顺序 项 的 向 量 : 
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"oranges", "limes", "grapes" 
如 来 有 ' 171 


for(int i=0;i<fruits.size();i++) 
cout<<fruits[il<<endl; 


那么 输出 是 

oranges 

limes 

grapes 

注意 1 后 置 条 件 没 有 指出 当 变 元 值 小 于 0 或 大 于 等 于 向 量 中 项 的 数量 时 会 怎样 。 在 调 
用 方法 前 保证 前 置 条 件 为 真是 vector 类 的 用 户 的 职责 。 


注意 2 这 个 方法 返回 一 个 引用 ， 也 就 是 一 个 地 址 。 因 此 可 以 修改 那个 地 址 的 内 容 ， 
正如 在 这 个 方法 接口 的 例 2 中 所 做 的 一 样 。 


注意 3 使 用 这 个 运算 符 不 会 改变 向 量 的 大 小 。 


9. /后 量 条 件 : 返回 位 于 向 量 开 头 的 迭代 器 。 
iterator begin(): 


例 假设 froits 是 有 如 下 顺序 项 的 向 量 : 

“oranges”, “kiwi”, “grapes” ; 17 
如 果 有 

vector<string>::iterator itr=fruits.begin(); 

那么 itr 就 位 于 “oranges” 项 的 位 置 上 。 


10. JGR: 返回 恰好 位 于 向 量 最 后 一 项 之 后 位 置 的 迭代 器 。 
iterator end(); 


例 假设 fruits 是 有 如 下 顺序 项 的 一 个 向 量 : 
“oranges”, “kiwi”, “grapes” 

如 果 有 

vector<string>: iterator itr=fruits.end(); 
那么 itt 就 恰好 位 于 “grapes” 项 之 后 。 因 此 消息 
fruits.insert(itr, "lemons"); 

将 和 下 面 的 消息 

fruits.push_back("lemons"); 

作用 相同 ， 也 就 是 ，fruits 将 包含 如 下 顺序 的 项 : 


“oranges”, “kiwi”, “grapes”, “lemons” 


bh 
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11. // 前 置 条 件 ， 这 个 向 量 非 空 ， 
/后 置 条 件 : 返回 对 这 个 向 量 开头 项 的 引用 。 
T& front(); 


” 例 假设 fruits 是 有 如 下 顺序 项 的 向 量 : 
“oranges”, “kiwi”, “lemons”, “grapes” 
WR A 
cout<<fruits.front(); 
输出 就 是 


oranges 


注意 1 这 个 方法 可 以 用 来 替换 向 量 中 开头 的 项 。 例 如 ， 假 设 写 出 
fruits frontQ="pears"; 

fruits 中 开头 的 项 就 变 成 了 “pears”。 这 条 语句 和 
fruits[0]="pears"; 

是 等 价 的 。 

注意 2 这 里 有 一 个 相似 的 方法 返回 对 向 量 尾 部 项 的 引用 : 

T& back(); 


在 方法 接口 8 的 例 3 中 ， 列 举 了 使 用 下 标 运算 符 operator[] 和 迭代 通过 向 量 的 方法 。5.2.2 节 
描述 了 vector 类 的 iterator 类 ， 它 提供 了 另 一 种 (但 不 是 等 价 的 ) KATA. 


5.2.2 向 量 和 迭代 器 


与 vector 类 关联 的 选 代 器 实际 上 是 指针 ， 因 此 任何 在 数组 中 可 以 用 指针 实现 的 问题 也 可 以 
在 问 量 中 用 迭代 器 实现 。 特 别 是 下 面 的 向 量 - 迭代 器 ( 即 指针 ) 运算 符 : ++，+，*，! = 和 
==。 例 如 ， 假 设 fruits 是 有 如 下 顺序 项 的 向 量 : 

“oranges”, “kiwi”, “grapes”, “lemons” 

可 以 按 下 面 的 方式 输出 fruits 里 的 全 部 的 项 : 

vector<string>:iterator itr; 

for (itr = fruits.begin( ); itr != fruits.end( ); itr+ +) 

cout << "itr << endi; 
在 方法 接口 8 的 例 3 中 ， 可 以 看 到 另 一 种 使 用 下 标 运 算 符 operator[] 解 决 同一 任务 的 方法 : 


for (unsigned i = 0; i < fruits.size( ); i+ +) 
cout << fruits [i] << endl; 


一 般 来 说 ， 如 果 itr 是 向 量 vec 中 某 一 项 位 置 上 的 向 量 和 迭代 器 ， 那 么 *itr 引 用 了 和 vecfitr- 


vec'begin()] 相 同 的 项 。 同 理 ， 如 果 vec 是 一 个 向 量 ， 那 么 可 以 得 到 数组 指针 定理 的 向 量 - 和 迭代 
a TELE o 








向 量 - 和 迭代 器 推论 


vec[n] 等 价 于 *(vec.begin()+n). 





因为 一 个 同 量 ~ 和 迭代 器 可 以 直接 访问 向 量 中 的 任 一 项 ， 所 以 向 量 - 迭代 器 是 属于 随机 访问 

下 面 通过 一 个 小 程序 阐述 了 比较 关心 的 几 个 向 量 方法 。 通 过 调用 push_back 生 成 一 个 随机 
薪水 向 量 ， 用 通用 型 算法 accumulate ( 见 第 3 章 ) 计算 这 些 薪 水 的 总 和 ， 然 后 输出 两 次 超出 平 
均值 的 薪水 ， 一 次 使 用 基于 下 标的 循环 ， 一 次 使 用 基于 迭代 器 的 循环 。 


#include <vector> 
#include <iostream> 
#include <string> 
#include <stdlib> 
#include <numeric> 


using namespace std; 


int main( ) 


{ 
const string PROMPT = "Please enter the number of salaries: "; 


const string ERROR_MESSAGE = 
"The number of salaries should be > 0.": 


const double SALARY FACTOR = 5.00; // 让 茶水 为 现实 的 
const string AVERAGE = "The average salary is "; 
const string ABOVE = "The above-average salaries are: "; 


const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


vector« double» salaries; 
vector « double- ::iterator itr; 


int n; // 薪水 数量 


cout << PROMPT: 
| einn 

if (n <= 0) | | 

cout << ERROR MESSAGE << endl: 

else | | 

{ 
for (inti = 0; i < n; i++) 
salaries.push_back (rand( ) * SALARY. FACTOR); 


double salarySum = accumulate (salaries.begin( ), 
salaries.end( ), 0.00); 

double averageSalary — salarySum / n; 

cout << endl << AVERAGE << averageSalary << endl; 
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cout << endl << endl << ABOVE << endl; 
for (inti = O;i < n; i++) 
if (salaries [i] » averageSalary) 
cout << salaries [i] << endl; 


cout << endi << endl << ABOVE << endl; 
for (itr = salaries.begin( ); itr != salaries.end( ); itr+ +) 
if (“itr > averageSalary) 
cout << "itr << endl; 
}in>O 


cout << end! << endi << CLOSE WINDOW PROMPT: 
cin.get( ); 
cin.get( ); 


return 0; 
) // main 


到 了 这 里 ， 读 者 可 能 认为 向 量 是 一 个 带 有 方法 的 、 自 动 调整 大 小 的 数组 。 大 概 就 是 这 
样 ! 在 5.2.3 节 中 还 会 稍 许 扩展 一 下 这 个 观点 ， 同 时 比较 向 量 和 第 2 章 的 Linked 类 ， 


5.2.3 问 量 和 其 他 容器 的 对 比 


癌 量 容器 和 数组 相 比 较 如 何 呢 ”向 量 相对 数组 的 最 大 优势 是 , vector 方 法 是 已 经 开发 好 的 ， 
而 数组 的 用 户 必 须 创建 维 护 数 组 时 所 必需 的 代码 。 例 如 ， 为 了 在 数组 的 任意 位 置 插入 或 按 除 ， 
必需 编写 代码 打开 或 关闭 空间 。vector 类 的 insert 和 erase 方 法 可 以 自动 地 进行 处 理 ， 而 
push_back 和 和 insert 方 法 可 以 在 向 量 空间 不 足 时 自动 调整 向 量 的 大 小 。 

问 量 和 数组 都 能 调用 标准 模板 库 的 通用 型 算法 ， 向 量 和 数组 也 都 允许 通过 下 标 运算 符 访 
问 或 修改 项 。 数 组 惟一 比 向 量 好 的 地 方 是 它 可 以 快速 初始 化 。 例 如 ， 可 以 定义 一 个 数组 并 马 


上 进行 初始 化 : 


string[] words={"yes","no","maybe"}; 


到 目前 为 止 所 接触 到 的 另 一 个 容器 类 是 第 2 章 中 非常 简单 的 Linked 类 。 对 于 在 Linked 容 器 开 
大 进行 的 插入 ，worstTime(m) 是 常数 ， 而 向 量 中 的 插入 只 有 在 平均 情况 下 是 常数 。 在 最 坏 情况 
下 ， 当 大 小 增加 时 ， 必 须 把 所 有 的 项 拷贝 到 一 个 更 大 的 向 量 中 ,但 这 是 极 少 发 生 的 。 向 量 的 一 
个 优点 是 它 带 有 方法 可 以 在 容器 的 任意 位 置 插 入 和 删除 项 ; 而 Linked 类 中 没有 这 样 的 方法 。 

最 后 ， 向 量 -迭代 器 是 随机 访问 选 代 器 ; 也 就 是 说 ， 一 个 向 量 -和 迭代 器 能 够 以 常数 时 间 访 
门 同 量 的 任意 项 。 链 式 和 迭代 器 的 功能 没有 这 么 强大 ; 访问 Linked 容 器 的 任意 项 ， 它 的 
worstIime(9) 是 与 距 容 器 头 的 距离 成 线性 关系 的 。 链 式 迭 代 器 属于 前 向 迭代 器 类 别 : 这 一 类 别 
的 迭代 器 只 可 以 通过 加 1 操作 前 进 通过 一 个 Linked 容 器 。 其 中 没有 减 运算 符 ， 也 没有 标量 加 法 。 

惠普 公司 提供 的 vector 类 的 原始 实现 细节 是 很 容易 令 人 迷失 的 。 这 个 实现 不 仅 像 预期 的 一 
样 效率 高 ， 而 且 很 简练 。 它 还 有 超出 想像 的 一 般 性 : 不 局 限于 单个 内 存 分 配 模型 。5.2.4 和 
5.2.5 市 给 出 了 一 个 路 线 图 来 理解 它 的 实现 ， 其 版 权 声明 为 : 

Copyright(c)1994 

Hewlett Packard Company 


Permission to use, copy, modify, distribute, and sell this software and its documentation for 





any purpose is hereby granted without fee, provided that the above copyright notice appears in all 
copies and that both that copyright notice and this permission notice appear in supporting 
documentation. Hewlett-Packard Company makes no representations about the suitability of this 


software for any purpose. It is provided “as is” without express or implied warranty. 


5.2.4 vector 类 可 能 的 字段 


没有 标准 模板 库 的 单个 实现 。 标 准 参 考 见 《STL Tutorial and Reference Guide? (Musser 
and Saini, 1996)， 其 中 提供 了 方法 接口 和 注意 事项 以 及 如 何 使 用 标准 模板 库 的 示例 。 只 要 满 
足 方法 接口 ， 实 现 者 有 极 大 的 自由 去 选择 字段 和 方法 接口 。 这 一 节 的 概要 是 基于 第 一 个 这 样 
的 实现 的 ， 它 来 自 于 惠普 研究 实验 室 。 

对 vector 类 ， 需 要 回答 的 第 一 个 问题 是 ,“ 项 将 存在 哪里 ? ”需要 一 个 连续 的 存储 结构 来 
支持 随机 访问 。 一 个 数组 ! 因此 得 到 一 个 指针 一 一 start， 它 存储 数组 第 一 个 位 置 的 地 址 。 

还 有 另外 两 个 指针 : 

finish， 它 指 问 紧 随 向 量 最 后 一 项 之 后 的 位 置 。 

end_of_storage， 它 指向 紧 随 数组 占据 的 最 后 一 个 空间 之 后 的 位 置 。 

编译 器 可 能 为 这 些 字段 使 用 不 同 的 标识 符 ， 或 使 用 不 同 涵义 的 令 人 信服 的 字段 。 


9.2.5 vector 类 的 一 个 实现 


现在 已 经 指定 了 字段 ， 可 以 直接 写 出 几 个 方法 的 定义 。 缺 省 构造 器 不 为 数组 分 配 存储 块 ， 
endO 方 法 只 是 返回 finish， 而 size() 方 法 返回 finish-start。 下 面 的 代码 将 产生 预期 的 输出 0: 


vector«double»weights; 
cout<<weights.size(); 177 


当 第 一 个 项 插入 向 量 时 (使 用 push_back 方 法 或 insert 方 法 )， 将 分 配 堆 中 的 一 个 存储 块 。 
这 个 块 的 大 小 随 编译 器 不 同 而 异 。 具 体 地 说 ， 假 设 分 配 了 1024 个 字 节 ， 并 且 一 个 double 占 据 
8 个 字 节 。 如 果 第 一 次 插入 消息 是 

weights.push, back(7.3); 

孝 么 就 分 配 128 个 double 型 数组 ， 如 图 5-1 所 示 。 

如 图 5-1 所 示 ，start 和 finish 字 段 分 别 指向 数组 的 第 一 个 和 第 二 个 单元 ， 并 且 
enad_-of_storage 字 段 指向 紧 随 数组 之 后 的 第 一 个 单元 。 消 息 

weights.size() | | 

将 返回 值 1， 即 finish~start。 并 且 消 息 

weights.begin() 

和 

weights.end() 


将 分 别 返 回 位 于 下 标 0 和 下 标 1 单 元 的 迭代 器 ( 即 指针 )。 
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weights[O] 
weights[1] 


weights[127] 
( 紧 随 数组 之 后 的 第 1 个 单元 ) 





图 5-1 使 用 push_back 方 法 将 7.3 插 入 之 后 的 vector<double>weights 
end_of_storage 在 这 个 实现 中 起 什么 作用 呢 ? 假设 将 另外 的 127 个 double 型 插入 weights。 
图 5-2 显 示 了 对 内 存 的 影响 。 
start 
weights[O] 
weights[1] 


end of storage weights[127] 
( 紧 随 数 组 之 后 的 第 1 个 单元 ) 





图 5-2 有 128 项 的 vector<double>weights 


现在 假设 发 送 下 面 的 消息 : 
178 weights.push_back(15.5); 


问题 是 finish=end_of_storage。 项 15.5 不 能 存 人 分 配给 weights 的 当前 块 ， 也 不 能 把 它 存 到 
end_of_storage 指 问 的 单元 ， 因 为 那个 单元 可 能 包含 其 他 一 些 程序 变量 (或 其 他 的 重要 信息 )。 
如 果 一 个 向 量 对 象 对 应 的 数组 已 满 且 又 尝试 新 的 插入 ， 那 么 这 个 数组 的 容量 将 加 倍 ， 

那 就 必须 增加 原先 的 数组 大 小 适应 新 的 项 ， 这 表示 分 配 一 个 新 的 堆 存储 块 。 那么 旧 的 项 
将 被 拷贝 到 新 的 数组 ， 旧 数组 的 存储 空间 被 回收 并 且 消 除 它 的 项 (通常 马上 进行 )， 然后 将 新 
的 项 插入 这 个 新 数组 。 为 了 避免 频繁 地 重复 拷贝 ， 分 配 的 块 是 当前 块 大 小 的 两 倍 。 图 5-3 显 示 





了 分 配 这 个 新 块 之 后 内 存 的 相应 部 分 ， 旧 项 被 拷贝 进 新 的 块 ， 插 入 新 的 项 ， 并 回收 旧 存 储 块 
的 空间 。 
Start 
weights[0] 
weights[1] 


weights[127] 
finish . weights[128] 
weights[129] 





weights[255] 
( 紧 随 数组 之 后 的 第 1 个 单元 ) 


end_of _storage 


T ee e o m 


图 5-3 调整 大 小 后 的 vector<double>weights 


这 个 调整 大 小 的 策略 说 明了 为 什么 push_back 方 法 的 averageTime(n) 是 常数 。 假设 向 量 的 
当前 容量 是 "项 ， 而 且 向 量 已 满 。 如 果 现 在 调用 push_back 方 法 zx 次 以 插入 nm 个 项 ， 那 么 将 进行 
多 少 次 数据 移动 昵 ? 为 了 插入 第 一 个 新 的 项 ， 分 配 的 存储 块 必须 能 存储 2n 个 项 ， 把 n 个 旧 项 移 
动 到 这 个 新 块 中 ， 然 后 添加 新 项 。 下 面 的 na-1 次 push_back 调 用 每 次 只 需要 移动 一 下 ， 因此 
push_back 的 "次 调用 中 项 被 移动 的 总 次 数 是 2m， 也 就 是 每 次 push_back 调 用 平均 需要 2 次 移动 。 

worstTime(n) 和 nn 是 成 线性 关系 的 ， 而 且 这 是 当 向 量 调整 大 小 时 出 现 的 。 但 是 就 像 在 上- 
段 中 看 到 的 ， 下 n- 1 次 push_back 调 用 只 花费 常数 时 间 。 这 个 现象 (一 次 方法 调用 和 nn 次 方法 调 
用 有 相同 的 worstTime(n) 估 算 ) 是 经 常 出 现 的 ， 因 此 可 以 将 它 归纳 成 一 个 函数 : 
amortizedTime(n)。 这 个 观点 是 指 ， 如 果 补 偿 ( 即 展开 ) 一 个 长 序列 的 方法 调用 代价 ， 方 法 调 
用 的 总 代价 除 以 方法 调用 的 次 数 可 能 很 小 。 这 里 的 “代价 ” 指 的 是 执行 的 语 旬 的 数量 。 对 
push_back 方 法 而 言 ，amortizedTime(n) 是 常数 。 在 应 用 中 ， amortizedTime(n) 计 算出 一 个 比 
”worstTime(n) 更 现实 的 估算 结果 。 而 amortizedTime(n) 的 计算 没有 做 averageTime(n) 计 算 所 需 
要 的 假设 一 -每 次 调用 都 和 其 他 任何 调用 有 着 相同 的 几率 。 


No 
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对 7 次 push_back 的 连续 调用 ， 整 个 调用 序列 的 worstTime(m) 和 n 是 成 线性 关系 的 ， 因 此 
amortizedTime(n) X "3 , 

辣 除 了 向 量 尾部 之 外 的 单元 进行 插入 需要 将 插入 点 之 后 的 每 一 项 依次 移 到 当前 单元 的 下 
一 单元 中 。 例 如 ， 假 设 从 图 5-3 所 示 的 向 量 开 始 ， 消 息 是 : 

weights.insert(weights.begin()+1,19.94): 

回忆 前 面 讲 过 的 ，begin 方 法 返回 start， 因此 weights.begin(O+1 将 指向 下 标 1 的 单元 上 。 从 
下 标 128 至 下 标 1 的 每 一 项 必须 移动 到 它们 的 下 一 个 下 标 单元 上 。 项 15.5 移 动 到 下 标 129 的 单元 ， 
然后 345.67 移 动 到 下 标 128 的 单元 …… 再 然后 84.7 移 动 到 下 标 2 的 单元 ， 最 后 19.94 移 动 到 下 标 1 
的 单元 ， 如 图 5-4 所 示 。 注 意 ， 插 入 的 结果 是 必须 修改 finish， 并 且 如 果 当 前 块 已 经 满 了 ， 那 么 
插入 就 需要 调整 大 小 。 


Start 


weights[0] 
weights[1] 
weights[2] 


weights[128] 
weights[129] 
weights[130] 


end of. storage  weights[255] 
( 紧 随 数 组 之 后 的 第 1 个 单元 ) 





图 5-4 同 图 5-3 的 vector<double>weights 中 的 下 标 1 单 元 插入 19.94 之 后 的 情形 


为 了 说 明 数据 移动 的 美妙 ， 这 里 是 简单 情况 下 的 insert 方 法 的 代码 ， 也 就 是 不 需要 调整 大 
/. # B.position!zendO: 


if (finish != end of storage) 
í 


~ construct (finish, *(finish — 1)); 








copy_backward(position, finish — 1, finish); 
“position = x; 
+ +finish; 


} 

调用 construct 把 向 量 的 最 后 一 项 (finish-1 指 向 的 ) 拷贝 到 下 一 个 单元 中 。 那 么 通用 型 算 
7% copy_backward#{" (finish- 2)# UL BI *(finish—1), j&g*(finish- 3)45 Dl BJ *(finish—2)------ 把 
“position 挡 风 到 *(position+1)。 最 后 ， 将 x 存 人 position 并 增加 finish。 

这 里 给 出 insert 的 完整 定义 ， 并 且 紧 接着 对 其 进行 了 解释 : 

iterator insert(iterator position, const T& x) 


{ 
size type n = position ~ begin( ); 
if (finish != end, of storage) 
if (position == end( )) 


{ 
construct(finish, x); 
finish+ +; 

} 

else 

{ 


construct (finish, *(finish — 1)); 
copy_backward(position, finish — 1, finish); 
*position = x; 

+ +finish; 


size type len = size( ) ? 2 * size ): static allocator init . page size( ); 

iterator tmp = static allocator.allocate(len); 

uninitialized copy(begin( ), position, tmp); 

construct(tmp + (position — begin( )), x); 

uninitialized copy(position, end( ), tmp -- (position — begin( )) + 1); 

destroy(begin( ), end( )); 

static allocator.deallocate(begin( )); 

end of storage = tmp + len; 

finish = tmp + size( ) 1; 

start — tmp; 
} | | 
return begin( ) + n; 
} 


这 个 定义 中 最 令 人 迷惑 不 解 的 行 是 赋值 语句 : 

size_type len=size()?2*size():static_allocator.init_page_size(): 

因为 假设 缺 省 分 配器 size_type 代 表 和 unsigned int 相 同 的 意义 。 赋 值 语句 右边 的 是 条 件 
运算 符 的 一 个 应 用 。 这 是 什么 ? 条 件 运 算 符 提供 了 常用 的 iWelse 语 句 的 简写 形式 。 例 如 ， 取 
代 下 面 的 语句 : 


ho 








SF 


if (first > second) 
big = first; 
else 
big = second; 
可 以 简单 地 写成 
big=(first>second) ?first:second; 
条 件 表达 式 的 语法 是 : 
condition? expression t:expression f 
它 的 意思 是 : 如 果 condition 为 true ， 条 件 表达 式 的 值 就 是 expression_t 的 值 。 否 则 ， 条 件 
表达 式 的 值 就 是 expression_f 的 值 。 
但 是 在 这 个 令 人 迷惑 的 赋值 语句 中 ， 简 单 地 调用 了 size 方 法 作为 条 件 : 
size() 


在 C++ 里 ，false 和 0 有 相同 的 含义 (都 和 NULL 意 义 相 同 ) 。true 等 价 于 任意 非 零 整 数 。 
称 条 件 sizeO 为 true 意 味 着 size0 非 零 。 因 此 这 个 令 人 迷惑 的 语句 的 意义 是 : 如 果 这 个 向 量 的 大 
小 不 是 0， 就 将 len 赋 值 成 这 个 向 量 大 小 的 两 倍 ; 否则 ， 就 将 len 赋 值 成 初始 块 的 大 小 。 

insert 方 法 剩余 的 部 分 不 难 理解 ， 但 是 读者 可 能 会 奇怪 为 什么 进行 

destroy(begin(),end()); 


的 调用 ， 这 是 为 向 量 的 每 一 项 调用 析 构 器 。 这 是 为 了 预防 那些 项 占据 比 数组 单元 多 的 空间 。 
例如 ， 向 量 中 的 每 一 项 自身 都 是 一 个 Linked 对 象 。Linked 对 象 在 数组 里 占据 的 空间 是 最 小 的 : 
head 和 length 字 段 。 但 是 Linked 对 象 中 的 节点 将 不 再 能 访问 了 。 如 果 没 有 回收 这 个 空间 ， 那 么 
内 存 泄漏 将 导致 程序 内 存 溢出 。 如 果 项 比 单个 数组 单元 占据 的 空间 少 ， 那 么 析 构 器 就 什么 也 
不 做 。 

写 push_back 和 insert 相 比 ，pop_back 方 法 的 实现 是 轻而易举 的 。 决 没有 任何 大 小 的 调整 ， 
因此 所 有 的 就 是 减 小 指针 finish， 另 外 ， 同 样 是 为 了 预防 的 目的 ， 需 要 调用 弹出 项 的 析 构 器 ， 
通用 月 的 的 erase 方 法 比 pop_back 方 法 更 复杂 些 ， 这 只 是 因为 必须 移动 项 来 填补 氛 除 项 留 下 的 
空间 。 

实验 12 包 括 了 vector 类 的 更 多 的 实现 细节 。 


实验 12: vector 类 的 更 多 的 实现 细节 (所 有 实验 都 是 可 选 的 ) 


了 解 所 有 这 些 vector 类 的 底层 工作 之 后 ， 很 高 兴 可 以 转移 到 高 层次 的 工作 ， 也 就 是 类 的 应 
用 上 。 应 用 处 理 了 任意 的 高 精度 算法 ， 它 是 公 钥 加 密 算法 的 主要 内 容 。 


9.3 癌 量 的 一 个 应 用 : 高 精度 算法 


现在 介绍 高 精度 算法 作为 vector 类 的 一 个 应 用 。 马 上 将 讨论 细节 问题 ， 但 是 有 必要 先 回想 
一 下 : 类 的 使 用 是 独立 (除了 效率 ) 于 类 是 如 何 实现 的 。 因 此 幸运 的 是 ， 不 需要 禁 锣 在 vector 
类 的 任何 具体 实现 中 。 

在 公 钥 加 密 算 法 中 ， 使 用 超过 100 位 长 的 整数 编码 和 解码 。 这 些 非 常 长 的 整数 的 基本 情 
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DUE: 
1) FAB 2b BERE RI —— O (0) — 4E B — 4 n fr dE RE HO OI. CEng. Bla, 
假设 想 生 成 一 个 500 位 的 素数 ， 那 么 需要 的 循环 迭代 的 次 数 大 约 是 500:= 125 000 000, 

公 钥 加 密 算 法 依赖 于 在 只 给 出 乘积 时 ， 将 乘积 分 解 成 两 个 非常 大 的 素数 的 乘积 的 指数 级 
难度 。 

2) 用 非常 长 的 时 间 一 一 粗略 估计 约 为 10"? 次 循环 迭代 一 一 求 出 一 个 不 是 素数 的 n 位 的 非常 
长 的 整数 的 素数 因子 。 例 如 ， 假 设 求 一 个 500 位 非 素数 的 因子 ， 那 么 需要 的 循环 迭代 次 数 近 似 
Fy 10°2= 10? , 

3) 假设 生成 了 两 个 非常 大 的 素数 p 和 gq。 可 以 快速 地 计算 乘积 (p-1)(g-1)， 并 可 以 把 这 个 
乘积 提供 给 任何 一 个 想 发 送 消 息 给 你 的 人 。 发 送 者 使 用 这 个 乘积 编码 消息 一 -详情 请 参阅 
Simmons(1992)。 乘 积 和 编码 消息 是 公开 的 ， 也 就 是 说 是 通过 不 安全 的 信道 ( 像 电话 、 邮 政 服 
务 或 计算 机 网 络 ) 进行 传送 的 。 | 

4) 但 是 解码 消息 需要 了 解 p 和 4 的 值 。 因 为 求 p 和 4 因子 需要 特别 长 的 时 间 ， 所 以 只 有 你 才 
能 解码 消息 。 

非常 长 的 整数 比 编程 语言 中 直接 可 用 的 整数 需要 多 得 多 的 精度 。 现 在 将 定义 、 设 计 和 实 
现 very_long_int 类 的 一 个 简单 的 版 本 。 习 题 5.5 要 求 增强 这 个 版 本 。 实 验 13 涉 及 了 这 个 增强 版 
本 的 驱动 器 的 开发 ， 编 程 项 目 5.1 进 一 步 扩展 了 very_long_int 类 ， 


5.3.1 very_long_int 类 的 设计 


Very-_long_int 类 的 每 个 对 象 将 包含 一 个 大 小 不 确定 的 非 负 整数 。 它 只 有 三 个 方法 : 一 个 很 
长 的 整数 可 以 读 人 ， 输 出 ， 或 是 和 另 一 个 很 长 的 整数 相 加 。 下 面 是 方法 接口 : 


1. /前 置 条 件 : 输入 是 一 系列 位 ， 后 面 跟着 一 个 'X'， 忽 略 无 效 的 位 和 字符 以 及 空格 、 





/ 行 尾 标志 。 开 头 处 没有 0 ， 除 非 是 0 自身 用 单个 0 表示 
Nig BRIE: very_long 包 含 了 非常 长 的 整数 ， 它 的 位 来 自 instream ， 并 返回 一 个 对 instream 
/l 的 引用 。worstTime(n) 是 O(n)， 其 中 n 是 输入 中 位 字符 的 数量 ， 


friend istream& operator>>(istream& instream,very_long_int& very. long); - 


B 假设 输入 包含 : 


473A53 
81X 


输入 语句 是 : 
cin>>very_long; 
那么 very_long 中 将 包含 4735381。 


2. // 后 置 条 件 :. 将 very_long 的 数值 写 入 outstream，。 worstTime(n) 是 O(n)， 
// 其 中 n 是 very_long 的 大 小 。 
friend ostream& operator<<(ostream& outstream, 
const very long. int very long); 


3. VREER: 返回 调用 对 象 (左边 的 操作 数 ) other very long. (右边 的 操作 数 ) 





避 ” 当 p 的 正 整数 因子 只 有 1 和 p 自 身 时 ， 那 么 大 于 1 的 整数 p 就 是 寨 数 。 
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// 的 总 和 。worstTime(n) 是 O(n)， 其 中 n 是 调用 对 象 和 other_very_long 中 
Hf 位 数 的 最 大 值 。 
very. long. int operator+(const very_long_int& other. very. long); 
例 假设 new_int 和 old_int 是 非常 长 的 整数 ， 它们 的 值 分 别 是 12345678901234567890 和 15。 
如 果 发 送 的 消息 是 
new_int + old_int 
那么 返回 的 数值 将 是 12345678901234567905。 
very long intjy 4 & Pe Beg? 可 能 需要 其 种 容器 ， 使 得 每 一 位 是 容器 的 一 项 。 但 是 
需要 什么 样 的 容器 呢 ， 是 数组 、vector 对 象 ， 还 是 Linked 对 象 。 在 这 个 应 用 中 ， 向量 的 自动 调 
整 大 小 特性 使 得 它们 比 数组 更 适合 ， 而 且 使 用 向 量 ， 我 们 早已 开发 了 大 量 的 方法 。 至 于 向 量 
和 Linked 结 构 之 间 的 选择 ，Linked 类 的 缺点 是 它 的 选 代 器 只 是 个 前 向 迭代 器 。 也 就 是 说 ， 只 
能 从 前 往 后 地 友 代 通过 一 个 Linked 容 器 ， 这 会 大 大 降低 加 法 的 效率 ， 因 此 在 这 个 应 用 中 选择 
vector% 。 
very-long_int 和 vector 之 间 的 相应 关系 是 什么 : 是 “是 一 个 ”( 继 承 ) 关系 还 是 “有 一 个 ” 
(SABA) 关系 ?也 就 是 说 ， very_long_int 是 vector 的 一 个 子 类 ， 还 是 令 very_long_int 包 含 
一 个 vector 类 型 的 字段 ?very_long_int 类 的 主要 目的 是 执行 算法 ， 因此 它 极 少 使 用 vector 类 的 
因数 。 更 好 的 说 法 是 “very_long_int 有 一 个 向 量 ” 而 不 是 “Very_long_int 是 一 个 向 量 ”。 
所 以 very_long_int 类 的 惟一 的 字段 是 digits， 一 个 vector 对 象 。 图 5-5 给 出 f very long int 
类 的 依赖 关系 图 。 由 于 调用 very_long_int 的 隐 式 析 构 器 时 将 为 向 量 digits 自 动 调用 析 构 器 ， 所 
以 采用 复合 。 






digits 


+ 
very_long_int 





图 5-5 very_long_int 类 的 依赖 关系 图 


向 量 digits 的 每 一 项 都 是 一 个 位 。 对 位 应 当 使 用 什么 整数 类 型 呢 ? 为 了 节约 空间 ， 我 们 
选择 了 char， 因 为 实际 上 在 所 有 的 编译 器 上 ， char 类 型 的 变量 只 占据 一 个 字 节 。 字段 的 定 
义 是 : 

vector<char>digits; | 

这 些 位 将 按照 通常 的 顺序 自前 向 后 地 存储 在 向 量 digits 中 。 例 如 ， 如 果 一 个 very_long_int 
的 值 是 758， 那 么 7 将 存储 在 下 标 0，5 存 储 在 下 标 1， 而 8 存储 在 下 标 2。 

现在 已 经 了 解 了 方法 接口 和 字段 ， 再 来 关注 一 下 类 的 实现 。 


5.3.2 very_long_int 类 的 一 个 实现 


这 一 王 给 出 了 重 载运 算 符 的 实现 : operator>>、 operator<<filoperator+., j#izvector 
类 的 优势 (快速 随机 访问 和 尾部 插入 ) 和 缺点 (在 除 尾 部 之 外 的 单元 插入 是 很 慢 的 )。 当 然 ， 








除了 效率 之 外 ， 所 有 的 这 些 都 不 依赖 于 vector 目 身 的 实现 细节 : 只 依赖 于 方法 接口 。 

1. istream& operator>>(istream& instream,very_long_int& very long) 

开始 时 ， 先 彻底 清除 very_long， 得 到 一 个 空 容器 。 然 后 不 断 读 人 字符 ， 直 到 到 达 “X 。 
对 每 位 的 字符 ， 通 过 调用 push_back 将 相应 位 的 值 增加 进 digits。 

下 面 是 方法 接口 : 

istream& operator>> (istream& instream, very long int& very long) 


| const char LOWEST DIGIT CHAR = '0*; 
const char HIGHEST, DIGIT CHAR = '9'; 
const char SENTINEL — X; 
char digit char; 
very long.digits.erase (very long.digits.begin( ), very. long.digits.end( )); 


do 


{ 
// 读 入 至 此 已 加 到 digits 的 每 一 位 。 
instream >> digit_char; 
If (LOWEST DIGIT. CHAR <= digit char) && 
(digit char <= HIGHEST. DIGIT CHAR)) 
very long.digits.push back (digit char — 
LOWEST. DIGIT. CHAR); 
) // do 
while (digit, char != SENTINEL); 


return instream; 


y BR>> 


这 个 运算 符 花 费 多 长 时 间 ? 对 输入 的 每 位 字符 进行 一 次 循环 迭代 ， 每 次 循环 迭代 的 平均 
时 间 依 赖 于 push_back 的 平均 时 间 ， 它 是 常数 。 因此 operator>> 的 averageTime(n) 和 nn 成 线性 
关系 ， 其 中 n 是 输入 的 字符 位 的 数量 。 

worstTime(m) 是 多 少 呢 ? 这 个 时 间 分 析 和 vector 类 的 push_back 方 法 的 分 析 相 关 。 回 忆 前 面 
的 介绍 ， n 次 push_back 调 用 的 worstTime(n) 和 成 线性 关系 : 也 就 是 说 ，operator>> 的 
worstTime(m) 和 7 成 线性 关系 。 


2. ostream& operator<<(ostream& outstream,very_long_int very_long) 


从 下 标 0 开始 遍历 向 量 digits 并 输出 获得 的 每 一 位 。 因 为 每 一 位 声明 的 类 型 都 是 char， 所 
以 需要 将 它们 转换 成 int。 否 则 ， 比 如 位 的 数值 是 7， 然 后 输出 将 是 第 7 个 ASCII 字 符 ; 这 时 没 
有 输出 任何 字符 ， 而 是 听 到 一 个 铃声 。 

下 面 是 代码 : 


Ostream& operator< < (ostream& outstream, const very_long_int very long) 
! — 
for (unsigned i = 0; i < very_long.digits.size( ); i++) 
outstream << (int)very_long.digits [i]; 








oo 
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return outstream, 
)/ BR << 


这 个 运算 符 的 worstTime(z) 和 7 成 线性 关系 ， 因 为 循环 迭代 的 数量 是 digits.size， 而 且 下 标 
运算 符 化 费 常 数 时 间 。 

可 以 重新 编写 for 语 句 ， 用 一 个 迭代 器 替代 下 标 : 

vector<char>::iterator itr; 


for (itr = very_long.digits.begin( ); itr != very_long.digits.end( ); itr+ +) 
cout << int (‘itr); 


3. very_long_int very long. int::operator- (const very long int& other very long) 


从 调用 对 象 和 other_very_long 对 象 的 最 低 有 效 位 开始 ， 将 它们 按 位 相 加 。 把 除 以 10 后 的 
部 分 和 添加 进 very_long_int 对 象 sum。 为 very_long_int 类 自动 调用 的 缺 省 构造 器 除了 为 sum 的 
digits 宇 段 调 用 缺 省 构造 器 之 外 ， 什 么 也 不 做 。 这 个 调用 使 得 digits 变 成 一 个 空 向 量 。 

如 条 部 分 和 大 于 10， 将 生成 一 个 进位 。 出 于 效率 的 考虑 ， 将 对 部 分 和 使 用 push_back， 所 
以 必须 在 加 法 之 后 反 转 向 量 digits ， 这 样 最 高 有 效 位 将 结束 在 下 标 0。 例 如 ， 假 设 newInt 是 一 个 
very_long_int 对 象 ， 数 值 是 328 ，oldInt 也 是 一 个 very_long_int 对 象 ， 数 值 是 47。 如 果 消 息 是 


newint+oldint 


那么 在 按 位 相 加 并 压 人 后 ，sum 中 包含 数值 5373。 反 转 后 sum 中 将 包含 正确 的 数值 375 。 因 
此 在 返回 Sum 之 前 调用 通用 型 算法 reverse。 
这 里 是 重 载 operator+ 的 代码 : 


very_long_int very_long_int::operator+ (const very_long_int& 
_ other_very_long) 
j 
unsigned carry = 0, 
larger_size, 
partial_sum; 


very_long_int sum; 


if (digits.size( ) > other_very_long.digits.size( )) 
larger size = digits.size( ); 

else 
larger size = other very long.digits.size( ); 


for (unsigned i = 0; i < larger size; i+ +) 

{ 
partial_sum = least (i) + other_very_long.least (i) + carry; 
carry = partial_sum / 10; 
sum.digits.push_back (partial_sum % 10); 

) / for 


if (carry == 1) 

sum.digits.push_back (carry); 
reverse (sum.digits.begin( ), sum.digits.end( )); 
return sum; 
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} // 重 载 + 


least 方 法 是 非 公 有 辅助 方法 的 一 个 示例 : 创建 它 是 为 了 简化 另 一 方法 的 实现 。 在 这 种 情 
况 中 ，least(i) 返 回 给 定位 向 量 中 的 第 i 个 最 低 有 效 位 。 个 位 (最 右边 ) 看 作 是 第 0 个 最 低 有 效 位 ， 
十 位 看 作 是 第 一 个 最 低 有 效 位 ， 依 此 类 推 。 例 如 ,假设 向 量 digits 的 值 是 3284971，i 是 2。 那 么 
返回 的 位 是 9， 因 为 9 是 digits 向 量 中 第 二 个 最 低 有 效 位 ; 第 0 个 最 低 有 效 位 是 1， 而 第 1 个 最 低 
有 效 位 是 7。 方 法 定义 是 : 

// 后 置 条 件 : 如 果 i>=digits.size()， 就 返回 0; 否则 返回 digits 中 的 第 i 个 

i 最 低 有 效 位 。 最 低 有 效 位 是 第 0 个 最 低 有 效 位 。 

char very long int::least (unsigned i) const 


{ 
if (i >= digits.size( )) 
return 0; 
eise | 
return digits [digits.size( ) ~ i — 1]; 
) // least 


为 了 简化 ， 假 设 调用 对 象 和 other_very_long 对 象 是 大 小 为 的 非常 长 的 整数 。 对 least 方 法 ， 
”averageTime(n) 是 常数 。 在 一 个 vector 中 进行 添加 平均 只 耗费 常数 时 间 ， 因此 Operator+ 定 义 
中 for 语 句 的 averageTime(n) 和 n 成 线性 关系 。 对 reverse 通 用 型 算法 而 言 ，averageTime(n) 和 n 成 
线性 关系 ， 因 此 operator+ 的 averageTime(n) 和 nn 成 线性 关系 。 通过 对 operator<< 进 行 相同 的 
分 析 ， 可 以 说 明 operator+ 的 worstTime(n) 和 nn 成 线性 关系 。 

注意 ， 如 果 以 反 序 存储 这 些 位 ， 那 么 operator+ 的 定义 可 以 稍微 简单 些 ， 而 时 间 估 算 不 会 


改变 。 但 是 读 入 一 个 非常 长 的 整数 的 时 间 将 和 n 成 平方 关系 ， 因 为 每 一 位 将 被 插入 到 向 量 


digits 的 前 面 。 | 
习题 3.5 扩展 了 very_long_int 类 ， 实 验 13 涉 及 到 这 个 扩展 的 实现 


实验 13: 扩展 very_long_int 类 | (所 有 实验 都 是 可 选 的 ) 


5.4 双 端 队列 


即将 讨论 的 下 一 个 顺序 类 是 deque 类 。 deque ( 双 端 队列 ) Æ “double ended queue” 的 缩 
写 , 但 它 的 发 音 是 “deck”。 双 端 队列 是 有 如 下 特征 的 项 的 有 限 序列 : 

1) 给 定 序列 中 任意 项 的 下 标 ， 就 可 以 花费 常数 时 间 访 问 或 修改 这 个 下 标 上 的 项 。 

2) 平均 情况 下 ， 在 序列 头 或 尾 的 插入 只 耗费 常数 时 间 ， 但 起 worstTime(m) 是 O(n)， X En 
代表 序列 中 项 的 数量 。 

3) 在 序列 尾 进行 的 插入 和 删除 ， 它 们 的 worstTime(n) 是 常数 。 

4) 对 任意 的 插入 和 删除 ，worstTime(n) 是 O(n)， averageTime(n) 也 一 样 。 

在 双 癌 队列 的 首尾 插入 和 删除 部 是 很 快 的 ， 而 向 量 只 有 在 尾部 进行 插入 和 删除 才 比 较 快 。 

从 概念 上 来 看 ， 向 量 和 双 端 队列 仅 有 的 区 别 是 : 双 端 队列 对 象 可 以 在 它 自身 的 首尾 快速 
地 插入 和 删除 ， 而 向 量 对 象 只 有 在 尾部 才能 快速 地 插入 和 删除 。 





448 0 LLLA 


deque 类 没有 (或 不 需要 ) vectors MycapacityFlreserve ik. PRI ZIP, deque% fitt 
的 关联 iterator 类 拥有 vector 类 及 其 关联 iterator 类 所 拥有 的 所 有 的 方法 接口 ， 而 且 还 多 了 两 个 双 
ia BA 91] 73 2: 

/后 置 条 件 : 在 这 个 双 端 队列 的 开头 插入 x 的 一 个 拷贝 。averageTime(n) 是 常数 ， 

// worstTime(n)#O(n), ， 而 对 n 次 连续 插入 ，worstTime(n) 也 只 是 OUn)。 


ÍI 也 就 是 说 ，amortizedTime(n) 是 常数 ， 
void push_front(const T& x); 


// 后 图 条 件 : 这 个 双 端 队列 开头 的 项 被 删除 。 
void pop front(); 


注意 — pop front $?& ERA x bid AAEM, A e HworstTime(n) X. 
常数 。 


无 疑 ， 对 于 容器 开头 进行 的 插入 和 删除 ， 双 端 队 列 要 比 向 量 快 很 多 。 下 面 是 它们 的 类 似 
之 处 : 

1) 在 癌 量 和 双 端 队列 中 ， 给 定 下 标 或 迭代 器 都 可 以 检索 或 替换 任意 项 ， 并 且 这 些 操 作 的 
worstTime(n) 都 是 常数 。 

2) 在 向 量 和 双 端 队列 中 ， 从 尾部 插入 一 个 项 的 averageTime(n) 都 是 常数 ， worstTime(n) #8 
是 O(n),， 但 是 对 n 次 连续 的 尾部 插入 ，worstTime(n) 也 只 是 O(n)。 也 就 是 说 ， amortizedTime(n) 
都 是 常数 。 

3) 在 问 量 和 队列 中 ， 删 除 尾部 项 的 worstTime(n) 都 是 常数 。 

根据 push_front 和 pop_front 的 估算 ， 给 人 的 印象 是 双 端 队列 有 时 比 向 量 快 ， 而 且 从 不 比 向 
量 慢 。 在 接 下 来 的 小 节 中 ， 当 看 到 deque 类 的 典型 的 字段 和 实现 时 ， 就 可 以 洞察 到 ， 除 了 开头 
或 接近 开头 的 位 置 ， 在 其 他 位 置 进行 的 插入 和 删除 中 ， 双 端 队列 比 向 量 稍 慢 - 一 些 的 原因 。 但 
征 这 里 首先 给 出 一 个 简单 的 程序 解释 双 端 队列 : 

#include <deque> 


#include <iostream> 
#include <istring> 


using namespace std; 


int main( ) 
{ 
const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


deque<string> words; 
deque<string>::iterator itr; 


words.push_back ("yes"); 
words.push_back ("no"); 
words.push_front ("maybe"); 
words.push front ("wow"); 


cout << endl << "the deque after 4 insertions:" << endl; 
for (unsigned i = 0; i < words.size( ); i+ +) 
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cout << words [i] << endl; | | 21 
words.pop. front( ); 
words.pop back( ); 


cout << endi << "the deque after deleting the front and back items" 
<< endl; | 

for (itr = words.begin( ); itr != words.end( ); itr+ +) 
cout << ('itr) << endl: 


words.front( ) = "now"; 
words.back( ) = "but": 


cout << endl << "the deque after replacing \"maybe\" with \"now\" " 
<< "and VyesV with \"but\"" << endl << "(words.begin( )) << endl 
<< *(words.end( ) — 1); 


cout << end! << endl << CLOSE_WINDOW_PROMPT: 


cin.get( ); 

return 0; 
} 4 main 
注意 用 了 三 种 不 同 的 方式 访问 了 words 的 开头 项 : 
words[O0] | 


words.front() 
*words.begin() 


同样 ， 也 用 了 三 种 不 同 的 方式 访问 了 尾部 的 项 。 程 序 的 输出 是 


the deque after 4 insertions: 
wow 

maybe 

yes 

no 


the deque after deleting the front and back items 
maybe | | 
yes 


the deque after replacing "maybe" with "now" and "yes" with "but" 
now 
but 


| please press the Enter key to close this Output window. | 
deque 类 的 字段 和 实现 MEM 
RU, BUE EAeTEdequeAe HREH. RATS Rs RT AI (但 


效率 不 同 ) 的 版 本 。 在 deque 类 的 惠普 的 设计 中 ， 主要 的 字段 是 一 个 指针 数组 ， 指 向 保存 项 的 
连续 存储 块 。 所 有 这 些 块 都 是 相同 大 小 的 。 一 个 块 能 够 保存 的 项 的 数量 是 1KB/ 项 的 大 小 。 指 
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针 数 组 ， 称 作 映 射 数组 ， 初 始 时 数组 从 头 到 尾 都 是 未 使 用 的 单元 。 中 间 单 元 将 指向 当前 保存 
双 端 队列 项 的 存储 块 。 字 段 start 和 finish 是 迭代 妖 ， 它 们 分 别 指 问 队 列 的 第 一 个 项 和 最 后 -项 
之 后 的 位 置 。 

在 一 个 简化 的 范例 中 ， 假 设 每 个 块 保 存 五 个 项 ， 并 且 deque 对 象 pets 包 含 了 11 个 这 样 的 项 ， 
依次 是 : “dog”, “cat”, “pig”, “gerbil”, “canary”, “duck”, “cow”, “horse”, “parrot”, 


“fox”, rabbit 。 图 5-6 显 示 了 如 何 表示 deque 对 象 pets ， 使 用 回 号 指示 未 使 用 单元 。 


et 


map 
一 


图 5-6 包含 11 个 项 的 双 端 队列 
像 下 面 的 消息 
pets.pop_front(); 


很 容易 处 理 : start 现 在 将 指向 “cat"。 但 是 在 双 端 队列 上 运行 下 面 的 消息 将 产生 什么 样 的 结 


FYE? 

pets.push_back("mouse"); 

pets.push, back("iguana"); 

项 “mouse” 被 添加 到 第 三 块 (2) 的 尾部 ， 而 迭代 器 finish 将 指向 第 三 块 尾部 之 后 的 位 
置 。 当 尝试 添加 “iguana” 时 ， 选 代 器 finish 将 超出 块 尾 ， 因 此 必须 分 配 一 个 新 的 块 。 图 5-7 显 
示 了 执行 pop_front 和 两 次 push_back 之 后 的 deque 对 象 pets 的 情形 。 
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parrot 
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finish 





图 5-7 对 图 5$-6 的 deque 进 行 一 次 pop .front 和 两 次 push_back 调 用 后 的 情况 
令 人 奇怪 的 是 ， 在 push_back 方 法 中 ， 如 何 决定 必须 分 配 一 个 新 的 块 。 这 些 还 有 iterator 字 


2) current, 指向 项 x 的 指针 。 m 
3) last， 指 向 包含 项 x 的 块 的 尾部 的 下 一 个 单元 的 指针 。 
4) node ， 指 向 map 中 单元 的 指针 ， 其 中 map 指 向 包含 项 x 的 块 首 。 
”例如 ， 假 设 双 端 队列 迭代 器 tr 位 于 图 5-7 的 双 端 队列 中 的 项 "duck"; 15-8 og T X638 
itr、start 和 finish 的 字段 的 值 。 在 这 个 图 中 ， 画 有 反 斜 线 的 框 表示 紧 随 块 尾 之 后 的 单元 。 请 用 
点 时 间 认真 学 习 图 5-8。 
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图 5-8 图 5-7 的 deque 及 其 迭代 器 细节 。 i X finish.current 
指 回 紧 随 双 端 队列 最 后 一 项 的 下 一 个 单元 


这 些 功 能 强大 的 迭代 器 允许 双 端 队列 方法 使 用 简单 的 算法 实现 头 尾 的 快速 插入 和 删除 ， 
以 及 在 给 定 下 标 时 检索 或 替换 任何 项 。 例如， 假设 有 : 


pets[9]="goose"; 
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为 了 返回 下 标 9 的 引用 ， 必 须 了 解 项 所 在 的 块 号 ， 还 有 它 距 该 块 开 头 的 偏 移 量 。 首 先 需要 
了 解 从 哪儿 开始 ， 即 到 块 0 中 第 一 个 项 有 多 远 ? 用 start.current 减 去 start.first， 得 到 4， 这 意味 
着 pets 中 第 一 个 项 一 一 项 0 一 一 在 第 一 个 块 中 的 偏 移 量 是 4。 然 后 将 4 和 给 定 下 标 9 相 加 得 到 13， 
因为 块 的 大 小 是 5，13/5 给 出 了 块 号 ， 即 2。 同 理 ， 块 的 偏 移 量 是 13%5，、 即 3，。 

因此 返回 对 块 2 中 偏 移 量 为 3 的 单元 的 引用 。 这 个 位 置 上 的 项 “rabbit” 被 赫 换 成 “goose”。 
现在 “goose” 在 双 端 队列 的 下 标 9 一 一 注意 第 一 个 项 “cat” 在 下 标 0。 

如 果 向 deque 对 象 pets 发 送 另 一 个 pop_front 消 息 ， 第 一 个 块 将 是 未 使 用 的 ， 因 此 可 以 回收 
它 ， 然 后 相应 地 调整 迭代 器 start。 下 面 是 pop_frontO 的 代码 ; 


void pop front( ) 
{ 
destroy(start.current); // 为 start.current 指 向 的 项 调用 析 构 器 
t +start.current; 
— —Jength; 
if (empty( ) || begin( ).current == begin( ).last) 
deallocate at begin( ); // 回收 这 个 块 
) 


push_front 方 法 首先 判断 是 否 需 要 在 队列 的 开头 分 配 一 个 新 的 块 。 然 后 减少 start.current , 
令 它 指向 新 块 开 头 的 下 一 个 可 用 单元 。 下 面 是 代码 : 


void push_front(const T& x) 


{ 
if (empty( ) || begin( ).current == begin( ).first) 
allocate at begin( ); 
— —Start.current; | 
construct(start.current, x); // 将 x 的 对 象 拷贝 进 start.current 
// 指向 的 单元 。 
+ +length; 


} 


是 全 需要 调整 大 小 ? 是 的 。 当 所 有 映射 指针 指向 的 块 都 被 使 用 而 又 需要 另 -- 个 块 时 ，map 
大 小 将 加 倍 ， 并 且 旧 的 指针 将 位 于 新 的 map 数 组 的 中 间 。 因此 双 端 队列 中 插入 的 大 O 时 间 估 算 
和 问 量 相同 : averageTime(n) 是 常数 ， worstTime(n) 和 nn 成 线性 关系 ，、 并 且 amortizedTime(n) 也 
是 常数 。 | 

当 调 整 大 小 时 ， 只 影响 map 数 组 : 正在 使 用 的 块 是 不 会 有 任何 改变 的 ! 回想 在 vector 类 中 ， 
当前 容量 的 增加 将 导致 所 有 的 向 量 项 被 拷贝 到 一 个 新 的 数组 中 ， 只 有 在 双 端 队列 中 在 除 头 尾 
以 外 的 单元 进行 插入 或 删除 时 才 需 要 重新 安排 项 。 例如， 在 图 5- -8 所 示 的 deque 对 象 pets 中 ， 如 
RBS E: 


itr.erase(); 


那么 这 将 导致 双 端 队列 中 “duck” 前 面 的 四 个 项 向 下 移动 (迭代 器 start 必 须 相 应 调整 )。 移 动 
项 的 代价 是 很 昂贵 的 ， 特别 是 当 有 很 多 项 或 每 一 项 都 很 大 时 。 但 是 即便 在 这 里 ，deque 类 也 提 
供 了 一 个 好 办 法 。 正 如 前 面 看 到 的 ， 如 果 即 将 删除 的 项 接近 双 端 队列 的 开头 ， 那么 前 面 的 项 
将 问 下 移动 。 但 是 如 果 即 将 删除 的 项 接近 双 端 队列 的 尾部 ， 那么 后 面 的 项 将 向 上 移动 。 因 此 
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一 个 双 端 队列 内 部 的 播 入 或 删除 将 平均 移动 1/4 的 项 。 

通过 前 面 的 介绍 说 明了 双 端 队列 类 幕后 的 复杂 性 ， 但 是 对 它 的 能 力 还 没什么 了 解 。 双 端 
队列 比 向 量 好 到 什么 程度 ? 现在 列 出 各 种 情况 : 

D 调整 大 小 时 没有 项 的 移动 。 当 在 双 端 队列 的 头 尾 插 和 人 时 需要 一 个 额外 的 块 ， 不 需要 移 
动 双 端 队列 的 任何 一 项 。 偶 然 情况 下 才 会 因为 map 自 身 太 小 了 ， 而 创建 一 个 双 倍 大 小 的 map ， 
然后 将 旧 的 map 拷 由 到 新 map 的 中 间 ， 但 这 也 没有 移动 项 。 在 向 量 中 ， 调 整 大 小 需要 移动 所 
有 的 项 。 

2) 对 deque 类 的 pop_front 方 法 ，worstTime(m) 是 常数 。vector 类 甚至 都 没有 pop_front 方 法 ， 
因为 它 的 worstTime(n) 和 n 成 线性 关系 ， 但 是 一 些 vector 类 的 用 户 可 能 天 真 地 假设 它 的 
worstTime(n) 像 pop_back 一 样 是 常数 。 为 了 从 向 量 vec 中 删除 开头 的 项 ， 应 当 执 行 下 面 的 语句 : 


vec.erase(vec.begin()); 


并 且 worstTime(n) 和 nn 是 成 线性 关系 的 。 
3) 在 双 端 队列 里 , push_front 平 均 只 耗费 常数 时 间 。vector 类 甚至 没有 一 个 push_front 方 法 。 


| 在 双 端 队列 里 ，push_front 可 能 需要 调整 map 的 大 小 ， 因此 worstTime(n) 是 O(n)， 因 为 map 的 大 


小 和 双 问 队列 中 项 的 数量 是 成 正比 的 。 但 是 amortizedTime(n) 仍 是 常数 。 

4) 在 双 端 队列 里 ,未 使 用 的 块 将 被 回收 。 如 果 一 个 双 端 队列 收缩 到 外 部 两 个 块 (位 于 
start 或 finish 的 块 ) 之 一 不 再 使 用 ， 那 么 将 回收 该 块 。 回 忆 一 下 ， 向 量 只 会 成 长 ， 但 从 不 收缩 。 

3) 对 内 部 的 插入 和 删除 ， 双 端 队列 比 向 量 要 少 几 次 数据 移动 。 例 如 ， 如 果 即 将 移动 的 项 
接近 双 端 队列 的 开头 ， 那 么 只 有 删除 点 之 前 的 项 被 移动 。 否 则 ， 只 有 删除 点 之 后 的 项 被 移动 。 
平均 情况 下 、 只 有 25% 的 项 将 被 移动 ， 而 向 量 是 50%。 

双 喘 队列 的 重大 缺陷 是 需要 模 算 法 将 下 标 转换 成 块 地 址 。 实 际 上 ， 除 非 大 多 数 操作 都 位 
于 或 接近 容器 的 开头 ， 否 则 向 量 是 比 双 端 队列 快 的 。 实 验 16 尝 试 着 比较 了 向 量 、 双 端 队列 和 
链表 (list 类 将 在 第 6 章 中 介绍 )。 其 间 ， 实 验 14 包 含 了 deque 类 的 惠普 实现 的 更 多 细节 ， 


| 实验 14: 惠普 的 deque 类 实现 的 更 多 细节 (所 有 实验 都 是 可 选 的 ) 


5.5 双 端 队列 的 一 个 应 用 : 非常 长 的 整数 


用 deque 类 处 理 非 常 长 的 整数 会 怎样 ? 可 以 主要 使 用 very_long_int 类 的 方法 定义 。 但 是 现 
在 digits 将 是 一 个 deque 对 象 ， 替 代 了 vector 对 象 。 出 于 效率 而 不 是 正确 性 上 的 考虑 ， 惟 一 的 改 
变 是 重 载 operator+。 这 里 将 使 用 push_front 替 换 push_back 来 求 部 分 和 与 进位 。 那 么 digits 将 不 
再 古 反 序 的 ， 因 此 可 以 避免 reverse 的 调用 。 这 些 改变 不 影响 大 0 时 间 ， 但 是 可 以 稍微 加 速 实际 
运行 。 
总 结 


mU SA 


本 章 介绍 了 两 个 顺序 容器 类 : vector 类 和 deque 类 。 向 量 比 数 组 要 功能 强大 得 多 。 比 如 向 
量 是 日 动 调整 大 小 的 。 当 向 量 不 断 成 长 超出 当前 容量 时 ， 就 创建 两 倍 大 小 的 数组 ， 并 把 向 量 
拷贝 到 这 个 数组 里 。 这 和 寄居 蟹 成 长 出 这 相仿 。 向 量 对 比 数组 的 一 个 更 大 的 优势 在 于 插入 和 
删除 ， 用 户 不 用 编写 代码 为 新 的 条 目 腾 出 空间 或 是 填补 被 删除 条 目的 空间 。 
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Ex f [n] ft A capacity Fflreserve Fy i; ( 见 编程 项 目 5.2 ) 而 双 端 队列 有 push_front 和 pop_front 
方法 不 同 以 外 ， 双 端 队列 和 向 量 有 相同 的 方法 。push_front 方 法 平均 只 花费 常数 时 间 ， 而 
pop_front 方 法 总 是 花费 常数 时 间 的 。 

问 量 和 双 端 队列 的 应 用 是 高 精度 算法 ， 它 是 公 和 钥 加 密 算 法 的 重要 组 成 。 


习题 
5.1 a. 假设 有 如 下 定义 : 


vector«char»letters; 

vector<char>::iterator itr; 

下 面 的 语句 序列 将 输出 什么 字 ? 
letters.push back ('f'); 

. letters.push back (‘i’); 
letters.push. back ('e'); 
letters.push. back ('rj; 
letters.push. back ('c); 
letters.push back ('e*); 
itr — letters.begin( ); 
cout << “itr: 
itr+ +: 
cout << “itr: 


cout << letters [3]; 
itr += 4; 
cout << “itr; 


5.2 假设 vector_plus 是 vector 类 的 一 个 子 类 ， 并 假设 vector_plus 设 有 新 的 字段 。 定 义 下 列 的 
每 一 个 vector_plus 方 法 : 


a. // 前 置 条 件 : 调用 对 象 中 有 一 个 项 等 于 item 。 
NEER 从 调用 对 象 中 删除 等 于 item 的 项 。worstTime(n) 是 O(n)， 
void erase_item (const T& item); 


提示 从 调用 通用 型 算法 find 开 始 。 例 如 ， 假 设 有 
item* ptr=find (fruits. begin(),fruits.end(),"bananas'); 


那么 ptr 将 位 于 fruits 中 “bananas” 出 现 的 位 置 上 ， 或 者 ， 如 果 “bananas” 没 有 出 现 
在 fruits 中 ， 就 位 于 紧 随 fruits 最 后 一 项 之 后 的 单元 上 。 


b. /后 置 条 件 : 调用 对 象 包含 全 部 其 原来 的 项 以 及 随后 的 vec 中 的 全 部 的 项 。 如 果 一 个 项 


li 在 原 调用 对 象 中 出 现 一 次 ， 在 vec 中 出 现 一 次 ， 那 么 那个 项 将 在 合并 
// 的 对 象 中 出 现 两 次 。 


void merge(const vector_plus<T>& vec); 
提示 这 可 以 通过 重复 调用 push_back 实 现 。 


c. "e NES IE: 返回 的 是 调用 对 象 中 惟一 项 的 数量 项 是 惟一 的 是 指 它 在 容器 
Ho. 中 只 出 现 一 次 。worstTime(m) 是 OUn*n) 。 
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int unique. count()const; 


提示 使 用 通用 型 算法 count。 例 如 ， 假 设 有 
int n=0; 
count(fruits.begin(),fruits.end(),"bananas",n); 
那么 n 将 包含 “bananas” 在 fruits 中 出 现 的 次 数 。 
5.3 在 设计 very_long_int 类 的 过 程 中 ， 决 定 使 用 (“ 有 一 个 ”关系 ) 而 不 用 继承 (“是 一 个 ” 
X) vector 类 。 为 什么 ? 
5.4 按 如 下 要 求 修改 very_long_int 类 的 设计 : digits 中 的 每 一 项 由 一 个 5 位 整数 组 成 。 这 对 
大 O 时 间 将 有 什么 影响 ?运行 时 间 呢 ? 
5.5 扩充 very_long_int 类 ， 增 加 方法 进行 初始 化 、 比 较 和 计算 斐 波 纳 自 数 。 方 法 接口 如 下 : 
a. // 后 置 条 件 : xx very long int35 55, 
very_long_int(); 
b. //Bi fF: n 是 一 个 非 负 整数 (不 是 very_long_int 类 中 的 对 象 } ， 
IARRI: 这 个 very_long_int 被 初始 化 成 n， 
void initialize(unsigned n); 
c. /前 置 条 件 : n 是 一 个 非 负 整数 CIR RVery long int3Em&gxr $&), 


// 后 置 条 件 : 用 n 的 初 始 值 构造 very_long_int， 
very long int(unsigned n); 


例 假设 消息 是 
very long. int temp_int(1); 
那么 结果 是 令 very_long_int 对 象 tetmp_int 的 值 是 1 
提示 pn%10 返 回 n 中 最 右边 的 位 。 
d. // 后 置 条 件 : 如 果 这 个 very_long_int 的 值 比 other_very_long 的 值 小 


/就 返回 真 ; BR, BER, WorstTime(n)Z0(n), 
bool operator<{const very_long_int& other very long) const; 


例 假设 定义 
very_long_int new_int(154), 
old_int(215); 


”如 果 发 送 消息 
new_int<old_int 


那么 将 返回 true。 


提示 。 如 果 这 两 个 very_long_int 的 大 小 不 同 ， 那么 小 一 些 的 very_long_int 的 值 一 定 小 
于 大 一 些 的 very_long_int 的 值 S。 如 果 大 小 相同 ， 就 从 最 高 有 效 位 开始 ; 逐 位 比较 两 
个 very_iong_int， 直 到 (除非) 两 个 数 的 对 应 位 不 同 。 


e. /后 置 条 件 : 如 果 这 个 very_long_int 的 值 大 于 other_very_long_int 的 


O 回想 一 下 ，very_long_int 的 开头 是 没有 0 的 。 








if 值 就 返回 真 。 否 则 ， 返 回 假 。 
bool operator>(const very_long_int& other_very_long) const; 201 


f. /后 起 条 件 : MIX very long int&f& & T other. very long int 
// 的 值 就 返回 真 : BR, ER. worstTime(n)3&O(n), 
boo! operator==(const very long int& other very long) const; 


g. // 前 置 条 件 : n 是 一 个 正 整 数 (不 是 very_long_int 类 中 的 对 象 ) 。 
/后 置 条 件 : 返回 第 n 个 斐 波 纳 契 数 。worstTime(nm) 是 Dln*n). 
very long. int fibonacci (int n)const; 
例 假设 发 送 下 面 的 消息 
temp_int.fibonacci(100); 
1B Bl fJ very. long. int] (A #F4354224848 17926 1915075——# 100 3E pk 44 eH 


提示 模仿 实验 10 中 严 波 纳 问 函数 的 选 代 设 计 。i 和 n 都 是 普通 整数 ， 但 是 previous、 


currentfetemp- X very long int, 


5.6 假设 开发 very_long_int 类 的 过 程 中 ， 决 定 使 向 量 digit 包 含 反 序 的 整数 。 例 如 ， 如 果 输 
入 包含 “386X”， 当 读 入 3 时 ， 它 将 被 存储 在 位 置 0。 然 后 读 和 人 8 并 存 人 位 置 0， 将 3 移 
到 位 置 1。 最 后 ， 读 人 6 并 存 人 位 置 0， 因 此 ， 得 到 6、8、3 分 别 位 于 位 置 0 到 位 置 2。 重 
新 定义 相应 的 重 载运 算 符 >> 、<< 和 +。 求 >>、<< 和 + 的 大 0 时间。 

5.7 vector 类 既 役 有 push_front 方 法 ， 也 没有 pop_front 方 法 。 以 你 的 观点 看 ， 为 什么 省 略 了 

”这 两 个 方法 ? 


编程 项 目 5.1: 扩展 very_long_int 类 


在 very_long_int 类 中 ， 为 多 个 应 用 开发 一 个 重 载 的 运算 符 以 及 一 个 阶乘 方法 。 下 面 是 接口 : 
I SR UE: 返回 值 是 这 个 very_long_int 和 otherVeryLong 的 乘积 。 

/worstTime(n) 是 O(n*n)， 其 中 n 是 调用 之 前 调用 对 象 的 位 数 和 
//other_very_long 位 数 之 中 较 大 的 一 个 。 

very_long_int operator*(const very_long_int& otherVeryLong); 


to 
© 
bo 


// 前 置 条 件 : n>=0, 

HERR: 返回 n 的 阶乘 。worstTime(n) 是 O(nlog(n!))， 即 n 次 乘法 ， 
// 每 个 乘积 的 位 数 少 于 log(n!) 即 n! 的 位 数 

very long int factorial(int n); 


用 实验 13 的 驱动 程序 验证 这 些 方法 。 
编程 项 目 5.2: deque 类 的 另 一 种 实现 
使 用 vector 类 实现 deque 类 。 不 要 使 用 标准 模板 库 中 惠普 的 实现 中 的 deque 类 ， 开 发 一 个 


| vector 类 的 子 类 来 简单 地 实现 。 它 有 助 于 读者 熟悉 另外 的 几 个 vector 方 法 : 
1. /后 置 条件 : 构造 大 小 为 n 的 向 量 。 每 个 项 的 值 由 T 的 缺 省 构造 器 给 出 ， 


vector(unsigned n); 
2. /后 置 条 件 : 返回 无 需 调 整 大 小 就 可 以 存储 在 向 量 中 的 项 的 数量 . 


b 
im 
UJ 
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unsigned capacity() const; 
3. /后 置 条 件 : 如 果 在 这 次 调用 前 ， 向 量 的 当前 容量 小 于 n， 那 么 癌 量 大 小 就 会 调整 成 
// 一 个 >=n 的 容量 . 
void reserve(unsigned n); 
在 deque 类 的 这 个 实现 中 ， 除 了 向 量 中 的 字段 ， 还 将 (至少) 有 两 个 字段 : 
unsigned front=START_SIZE/2, 
back=START_SIZE/2-1; 
front 和 back 字 段 分 别 是 双 端 队列 头 尾 的 下 标 。 构 造 器 将 双 端 队列 初始 化 成 START_SIZE 
( 即 100) 个 项 ， 每 个 项 的 值 都 由 T 的 构造 器 给 出 。 那 么 开始 时 front 是 50，back 是 49。 有 几 个 方 
法 被 覆盖 。 例 如 ，begin(0) 返 回 start+front， 而 endO 返 回 starttback+]。 
基本 上 ， 在 项 x 上 应 用 push_front 方 法 ， 得 到 : 


front++; 

(*this)[0]zx; 

在 项 x 上 应 用 push_back 方 法 ， 得 到 : 
back++; 


(*this)[back- front]zx 

任何 时 候 双 端 队 列 的 大 小 都 是 back-front+1。 这 里 要 说 明 一 个 复杂 的 情况 ， 当 调用 
push_front 之 前 front 值 为 0, 或 是 调 用 push_back 之 前 back 的 值 是 capacity()- L. 在 和 任 一 种 情况 下 ， 
加 量 的 大 小 都 将 加 倍 : | 

reserve(2*capacity()); 

双 端 队列 原先 的 内 容 现 在 放 在 调整 大 小 后 的 双 端 队列 的 下 半 部 分 ， 因 此 需要 重新 居中 ， 
将 这 些 项 向 高 下 标 方向 移动 。 如 果 设 置 

unsigned nzcapacity(); 
那么 下 标 n/2 位 置 的 项 将 被 移动 到 下 标 3n/4， 下 标 n/2- 1 位 置 的 项 将 被 移动 到 下 标 3n/4-1， 依 次 

204| 类推 。 现 在 可 以 按照 描述 进行 插入 。 








第 6 章 X 


本 章 通过 介绍 另 一 个 顺序 容器 类 继续 学 习 标 准 模板 库 的 数据 结构 ， 这 个 类 为 list 类 。 在 表 
和 向 量 (或 者 双 端 队列 ) 之 间 ， 性 能 上 存在 重大 的 差别 。 例 如 ， 表 缺乏 向 量 的 随机 访问 特征 : 
访问 表 中 某 个 下 标 处 的 项 需要 从 表 头 或 表 尾 (接近 该 下 标的 一 端 ) 开始 循环 。 但 是 一 旦 定位 
了 进行 插入 或 删除 的 位 置 ， 表 就 能 够 以 常数 时 间 进 行 插入 和 删除 。 这 使 得 选 代 器 成 为 几乎 所 
有 表 应 用 的 基本 要 素 ， 而且，list 类 还 缺少 下 标 运 算 符 Operator[]。 

在 定义 表 是 什么 之 后 ， 就 列举 list 类 和 它 的 关联 iterator 类 的 一 些 方法 接口 。 这 个 用 户 的 视 
角 全 部 是 由 标准 模板 库 指 定 的 。 然 后 提供 惠普 的 设计 和 实现 的 一 个 大 体 轮廓 ， 并 提出 简单 些 
(但 效率 低 些 ) 的 设计 。 表 的 应 用 描述 了 一 个 简单 的 行 编辑 器 ， 利 用 表 的 能 力 在 任意 位 置 快速 
地 连续 插入 和 删除 。 


目标 


1) 从 用 户 角度 和 开发 者 角度 全 面 地 理解 list 类 。 

2) 给 出 一 个 需要 顺序 容器 类 的 应 用 ， 并 能 判断 表 、 向 量 或 双 端 队列 中 哪 一 个 更 适合 这 个 
应 用 。 

3) 比较 list 类 的 惠普 的 设计 和 单 表 设计 以 及 带 有 头 尾 字段 的 双向 表 设计 。 


6.1 X 


日 常生 活 中 常常 为 了 排序 而 构造 表 : 杂货 铺 的 杂货 清单 ， 登 记 表 ， 电 话 目录 ， 班级 化 名 
册 ， 电 视 节 目 表 等 等 。 因 此 ， 表 中 经 常 表 述 的 问题 如 : 

给 出 一 系列 的 测验 成 绩 ， 将 它们 按 升序 排序 。 

输出 所 有 欠 缴 费用 的 俱乐部 成 员 的 名 单 。 

表 一 一 有 时 称 作 链表 ， 是 项 的 有 限 序列 ， 它 具有 下 列 特征 : 

1) 访问 或 修改 序列 中 的 任意 项 需要 花费 线性 时 间 。 

2) 给 出 序列 中 某 一 位 置 的 迭代 器 ， 在 这 个 位 置 上 插入 或 删除 一 个 项 需要 花费 常数 时 间 。 

从 6.1.1 刷 开始， 我 们 将 设计 并 实现 符合 这 个 数据 结构 的 list 类 。 那 么 表 的 这 两 个 属性 与 向 
量 对 象 的 行为 相 比如 何 呢 ? 回忆 一 -F 访问 或 修改 向 量 vec 中 位 置 上 的 项 ， 可 以 采用 下 标 运 
算 符 : 


vec[k] 


下 标 运算 符 也 可 以 用 于 双 端 队列 。 在 表 中 ， 必 须 使 用 迭代 器 。 假 设 jis 是 list 类 的 一 个 实例 ， 
而 我 们 想 访问 从 lis 头 开始 算 起 的 第 k 个 位 置 上 的 项 。 PAAA is HAP BE BBO Ek, 或 是 
从 lis 的 末尾 后 退 到 位 置 k， 人 这 两 者 中 选择 一 一 条 较 短 的 路 径 : 


if (k < lis. size( )/2) 
( 





160 ROR 





H 从 lis 开 头 循环 前 进 : 


itr = lis.begin( ); 
for (int i = 0; i < k; i++) 
itr+ +; 
}/ if 
else 


{ 
H Klis 7R RE f) fes VR E: 


itr = lis.end( ); 
for (int i = lis.size( ); i > k; i——) 
itr 一 一 ; 
) // else 


XX A VIRI AST Ta] AK RIE Eb. Srk RAR ARE. TERRENAE, Hkt, JEI 
XE ICH SCRI n/2, Fn RAPE AR. MBSE TT 3I CK LHP E en/A, H Flin p, £x ME 

AP BÉ f [5] Et A A dia BA 7 ABFE LA A CERE EE 7 75 [2] 9 JE] Tek Be ER BE ANB Lids Io] ok AR 

206 得 ， 而 只 是 双向 选 代 器 。 这 意味 着 从 链表 的 一 个 给 定位 置 上 ， 和 迭代 器 可 以 前 进 或 后 退 一 个 位 

置 。 对 比 前 面 章节 中 ， 随 机 访问 迭代 器 可 以 直接 前 进 或 后 退 任意 个 位 置 。 

但 是 一 旦 准确 地 定位 了 一 个 迭代 器 ， 在 链表 中 这 个 位 置 的 插入 或 删除 就 只 需要 常数 时 间 ， 
而 在 辣 量 或 双 端 队列 中 则 需要 线性 时 间 。 这 说 明了 使 用 链表 取代 向 量 (或 双 端 队列 ) 的 主要 
动机 : 当 应 用 需要 在 除了 容器 尾部 (对 双 端 队列 而 言 是 头 尾 两 端 ) I pr E ETT de edil Ac DN 
除 时 ， 适 合 使 用 链表 。 

多 个 链表 的 合并 只 需要 常数 时 间 。 举 一 个 例子 解释 “合并 ”的 意思 ， [B t list 包含 项 

"television", "radio", "stereo", *CD player" 

mak itr F “radio”, 如 果 1list2 包 含 项 

“camcorder”, “VCR”, “laser disk player” 

可 以 发 送 下 面 的 消息 : 

list1 .splice(itr,list2); 

结果 是 list2 的 项 从 list2 中 移 走 并 插入 到 list1 中 项 Tadio” 的 前 面 。 因 此 1ist1 将 包含 


“television”, “camcorder”, “VCR” , laser disk player", 

“radio”, “stereo”, “CD player” 

而 list2 为 空 。 至 此 ， 读者 大 概 能 领会 到 向 量 或 双 端 队列 的 合并 需要 和 提供 合并 项 的 容器 的 
大 小 成 正比 的 线性 时 间 的 原因 。 


6.1.1 list 类 的 方法 接口 


list 类 和 它 的 关联 iterator 类 的 方法 接口 和 前 面 在 向 量 及 双 端 队列 中 看 到 的 很 相位。 FEMA list 
类 中 应 用 最 广泛 的 方法 的 接口 开始 。 表 6-1 简 赂 地 概括 了 这 些 方法 ， list 类 是 模板 类 ， 有 表示 链 
表 项 类 型 的 模板 参数 T.。 
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X6-1 一 些 list 方 法 的 简要 描述 (假设 定义 为 : list<double>::iterator itr;) 


b d D 能 

list<double> x x 成 为 一 个 空 链表 

list<double> weights(x) list fe weights I liste Rx (HH yl 

weights.push, front(8.3) 在 weights 的 开头 插入 8.3 

weights.push_back(107.2) 在 weights 的 尾部 插入 107.2 

weights.insert(itr,1 25.0) 在 itr 所 在 的 位 置 插 入 125.0; 将 插入 点 到 weights 尾 部 之 间 的 项 向 上 移 
动 ; 返回 指向 刚 插 入 项 的 友 代 器 

weights.pop. front() 删除 weights 开 头 的 项 

weights.pop_back() 删除 weights 尾 部 的 项 

weights.crase(itr) 删除 itr 所 在 位 置 的 项 ;只 有 那些 被 删除 项 位 置 上 的 迭代 器 和 引用 失效 

weights erase(itr | ,itr2) 删除 weights 中 itri 所 在 位 置 (包括 itrl) 到 itr2 所 在 位 置 (不 包括 itr2) 
之 间 的 项 

weights.size() 返回 weights 中 项 的 数量 

weights.empty() 如 果 weights 中 没有 项 就 返 同 true; 否则 ， 返 回 fatse 

itr=weights,begin() 令 itr 位 于 weights 开 头 的 项 | 

itr==weights end() 如 采 itr 恰 好 位 于 紧 随 weights 最 后 一 项 之 后 的 位 置 就 返回 true; dr, 
返回 false 

new_weights=weights 先前 定义 的 list 对 象 new_weights 中 包含 weights 的 一 个 拷 岁 

weights.splice(itr,old_weights) 把 ol1d_weights 中 的 所 有 项 放 在 weights 里 itr 所 在 位 置 的 前 面 。 不 论 
weights 或 old_weights 里 原先 有 多 少 项 ， 这 个 方法 的 时 间 总 是 常数 

weights.sort() 根据 operator< 排 序 weights 中 的 项 


TT 


1. /后 置 条 件 : 这 个 链表 为 空 。 
list(); 


注意 通常 部 是 隐 式 地 调用 这 个 缺 省 构造 器 ， 例 如 ， 
list<Employee> employees; 
令 employees 成 为 一 个 空 链表 ， 它 的 项 是 Employee 类 型 的 。 


2. ly WES E: 构造 链表 并 将 其 初始 化 为 x 的 拷贝 。 
Hf worstTime(n) 是 O(n)}， 其 中 n 是 x 的 大 小 ， 


list(const list<T>& x); 
例 假设 前 面 定义 了 一 个 字符 串 链表 old_words。 如 果 写 成 
list<string> new words(old words); 
那么 new_words 被 构造 并 包含 了 old_words 的 拷贝 。 
注意 回忆 第 $ 章 ， 这 种 类 型 的 构造 器 称 作 拷贝 构造 器 。 


3. // 后 置 条 件 : 将 x 插入 到 这 个 链表 的 开头 。 
void push_front(const T& x); 


注意 。 vector 类 没有 push_front 方 法 。 这 样 方法 可 能 给 人 的 印象 是 在 vector 对 和 象 开头 的 
BARE, 


4. /后 置 条 件 : 在 这 个 链表 尾部 插入 x。 
void push_back(const T& x); 





bo 
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5. /后 置 条 件 : 将 x 插入 到 调用 前 position 所 在 位 置 的 项 的 前 面 。 返 回 位 于 x 位置 
// ERIE TCE. 


iterator insert(iterator position, const T& x); 
注意 worstTime(n)E FR, x] vector X &jinsertzr ik, worstTime(1) X O(n), 


6. /前 置 条 件 : 这 个 链表 非 空 。 

WERE: 将 调用 前 这 个 链表 开头 的 项 从 链表 中 删除 。 
void pop. front(); 

ARBRE: 这 个 链表 非 空 。 

(peri: 将 调用 前 这 个 链表 尾部 的 项 从 链表 中 删除 。 
void pop_back(); 


. // 前 置 条 件 : position 位 于 链表 中 某 项 上 
// 后 置 条 件 : 将 调用 前 position 位 置 上 的 项 从 链表 中 删除 。 
void erase(iterator position); 


- 


Oo 


注意 worstTime(n) ZF HK, vector Ħ erase% i # worstTime(n)X O(n). 


9. /前 置 条 件 : first 位 于 链表 的 某 一 项 上 ， 而 last 位 于 该 项 之 后 的 某 项 上 ， 
/后 置 条 件 : 将 调用 前 所 有 位 于 first (包括 first) 和 last {不 包括 last) 
// 之 间 的 项 从 链表 中 删除 。 


void erase(iterator first,iterator last); ， 


注意 ”这 个 方法 的 时 间 和 删除 的 项 的 数量 成 正比 。 回 忆 在 对 应 的 vector 方 法 中 ， 这 个 
时 间 是 和 删除 的 最 后 一 项 之 后 的 项 的 数量 成 正比 的 ( 因为 需要 移动 后 面 的 那些 项 来 
填 满 清空 的 位 置 )。 
10. /后 置 条 件 : 返回 这 个 链表 中 项 的 数量 ， 

unsigned size() const; 


11. /后 置 条 件 : 如 果 链 表 为 空 就 返回 真 。 否 则 ， 返 回 假 。 


bool empty() const: 


12. /后 置 条 件 : 返回 位 于 这 个 链表 开头 的 迭代 器 。 
iterator begin(); 


13. /后 置 条 件 : 返回 位 于 这 个 链表 末尾 后 的 迭代 器 ， 

iterator end(); 
注意 ”如果 调 用 对 象 链表 为 空 ， 那 么 begin 方 法 返回 &Jiterator3t, 3- T end Zr ik i& ve) 6 ik 
A S. 
14. /后 置 条 件 : 这 个 链表 包含 了 x 的 拷贝 ,并 返回 对 这 个 链表 的 引用 ， 

list<T>& operator=(const list<T>& x); 
注意 “这 个 赋值 运算 符 与 拷贝 构造 器 (方法 2) 的 不 同 之 处 在 于 ， 拷 由 构造 器 的 调用 
对 象 在 被 初始 化 为 参数 x 的 同时 还 进行 了 定义 。 


15. HG RR: 从 position 位 置 开 始 将 x 的 内 容 插 入 这 个 链表 ， 然 后 x 为 空 ， 
void splice(iterator position, list<T>& X); 
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注意 不 论 x 多 大 ， 这 个 方法 总 是 花费 常数 时 间 。 


16. /前 置 条 件 : 为 类 型 T 定 义 了 运算 符 >。 
// 后 置 条 件 : 这 个 链表 中 的 项 按照 升序 排列 。worstTime(n) 是 O(nlogn)。 


void sort(); 
注意 将 在 第 12 章 中 学 习 这 个 方法 。 
链表 中 也 有 front 和 back 方 法 ， 它 们 的 方法 接口 与 向 量 中 的 相同 。 
6.1.2 和 迭代 器 接口 
list 类 支持 双向 迭代 器 ， 而 不 是 随机 访问 选 代 器 。 没 有 运算 符 + 就 是 一 个 很 好 的 说 明 。 下 
面 是 接口 : | 
1. /后 置 条 件 : 这 个 迭代 器 位 于 链表 的 下 一 个 位 置 ， 并 返回 对 这 个 迭代 器 的 引用 。 
iterator& operator++(); | 
注意 ”这 是 一 个 前 加 运算 符 ; CHAM, RREA Dp Ap Y ik 3$ 89 21 RI. 
例 如 , 假设 cities 有 是 一 个 list 对 5 ; TATH 的 城市 : 


ho 
jum 
© 


“Boston”, “College Station”, “Lansing”, “Pasadena” 

如 果 it 是 位 于 “College Station” 上 的 链表 迭代 器 ， 并 编写 了 
list<string>::iterator new_itr=++itr; 

那么 itr 和 new_itr 就 都 位 于 “Lansing” 上 了 。 


2. /后 置 条 件 : 这 个 迭代 器 位 于 链表 的 下 一 个 位 置 ， 并 返回 对 迭代 器 前 一 个 值 
// 的 拷贝 。 


iterator Operator++(int) 


注意 ”这 是 一 个 后 加 运算 待 ; 也 就 是 说 ， 迄 代 器 前 进 但 返回 前 进 之 前 达 代 器 的 值 。 
后 加 运算 符 有 一 个 int 类 型 的 参数 ,使 用 它 的 惟一 目的 是 为 了 与 前 加 运算 符 相 区 别 。 
实际 上 并 没有 变 元 对 应 这 个 int 参 数 。 例 如， 假设 cities 是 一 个 list 对 象 ， 它 包含 下 面 
的 城市 : 


“Boston”, “College Station”, “Lansing”, “Pasadena” 


如 有 果 itr 是 位 于 “College Station” 的 链表 迭代 器 并 编写 了 

list<string>::iterator old_itr=itr++; 

那么 itr 就 位 于 “Lansing”， 但 是 old_itr 仍 位 于 "College Station", 

3. // 后 置 条 件 : 2 的 前 一个 位 置 ， SHE RE TERMS. 
iterator& operator--();//Bij x& | 


. // 后 置 条 件 : 这 个 适 代 器 位 于 链表 的 前 一 个 位 置 并 返回 对 这 个 迁 代 器 前 一 个 介 
gH. WEN, 
iterator operator--(int);// 后 减 


t2 
p 
MÀ 


5. ARR: 这 个 迭代 器 位 于 链表 的 某 一 项 上 。 
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HEUS 返回 对 这 个 迭代 器 位 置 上 的 项 的 引用 。 
T& operator*(); 


例 假设 itr 位 于 项 “Lansing” 上 。 如 果 编 写 了 
cout<<(“*itr); 
答 出 将 是 


Lansing 


POF 


注意 ”因为 返回 了 一 个 引用 ， 所 以 可 以 使 用 这 个 运算 符 来 改变 链表 中 一 个 项 的 值 ， 
例如 ， 


*itrz"Detroit"; 


RAC hie Bb AAR "Detroit", 


6. HERRE 如 果 这 个 迭代 器 和 x 位 于 链表 相同 的 地 方 ， 就 返回 真 。 否 则 ， 返 回 假 。 


bool operator==(const iterator& x); 


注意 iA operator! =, 


XX HE — 7S FP APPR IL AT E 2 EMAER ERE EAT. 


#include <list> 
#include <iostream> 
#include <string> 


using namespace std; 


int main( ) 


{ 


list<string> words; 
list<string>::iterator itr; 


words.push back ("yes"); 

words.push back ("no"); 

words.push frorit ("maybe"); 

words.push front ("wow"); 

cout << "size = "<< words.size( ) << endl: 


cout << endl << "the list after 4 insertions:" << end; 
for (itr = words.begin( ); itr != words.end( ); itr+ +) 
cout << (*itr) << endl; 


words.pop_front( ); 
words.pop_back( ); 


cout << end! << "the list after 2 deletions:" << endl; 

for (itr = words.begin( ); itr != words.end( ); itr+ +) 
cout << ('itr) << endi; 

cin.get( ); 


return 0: 


} // main 
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这 个 程序 的 输出 是 : 
size = 4 


the list after 4 insertions: 
WOW 

maybe 

yes 

no 


the list after 2 deletions: 
maybe 
yes 


在 开始 学 习 list 类 可 能 的 实现 之 前 ， 应 当先 从 用 户 的 观点 ， 即 标准 模板 库 的 数据 结构 出 发 ， 
比较 链表 和 辣 量 (或 双 端 队列 )。6.1.3 节 探讨 了 链表 和 向 量 作为 数据 结构 的 区 别 。 


6.1.3 链表 方法 和 向 量 或 双 端 队列 方法 的 差别 


如 果 应 用 需要 访问 或 修改 顺序 容器 中 位 置 过 异 的 项 ， 就 选择 向 量 (ABUA), 
list 方 法 和 vector 或 deque 方 法 的 最 显著 的 差别 是 list 类 中 没有 下 标 运 算 符 一 operator[]。 
这 意味 着 链表 缺乏 随机 访问 属性 。 在 6.1 节 中 曾 看 到 ， 通 过 从 链表 头 部 或 尾部 开始 循环 ， 可 以 
模拟 下 标 运 算 符 的 作用 ,但 是 这 样 花费 的 时 间 和 从 开头 (或 末尾 ) 项 到 给 定 下 标 项 之 间 的 项 
的 数量 成 线性 关系 。 
因此 当 应 用 需要 访问 或 修改 顺序 容器 中 位 置 闻 异 的 项 时 ， 使 用 向 量 或 双 端 队列 
将 比 使 用 链表 快 很 多 。 
如 果 应 用 需要 迭代 通过 一 个 顺序 容器 并 在 过 代 中 进行 插入 或 删除 ， 就 选择 链表 。 
男 一 方面 ， 在 链表 中 插入 或 删除 一 个 交代 器 所 在 位 置 上 的 项 只 只 需要 常数 时 间 ， 而 在 向 量 
或 双 端 队列 中 却 需 要 线性 时 间 。 
如 果 应 用 的 大 部 分 工作 都 是 迭代 通过 一 个 顺序 容器 以 及 在 迭代 中 进行 插入 或 删 
除 ， 那 么 使 用 链表 要 比 使 用 向 量 或 双 端 队列 要 快 很 多 。 
list 类 和 vector 或 degue 类 之 间 的 另 一 个 差别 是 宪 入 和 删除 将 导致 送 代 器 失效 的 程度 通常 ， 
链表 中 的 插 人 和 前 除 只 会 使 直接 相关 的 和 迭代 器 失效 。 例 如 ， 假设 lis 是 一 个 链表 对 象 ，itr1 和 
itr2 是 迭代 器 。 TURIS Tcal GO T RARE TE AJLA, 那么 消息 


lis.erase(itr1); 


将 令 itr1 失 效 。 也 就 是 说 ， 正如 人 科 所 期 望 的 ， itr1 将 不 再 依赖 于 指向 item1 的 指针 。 但 是 
itr2 将 仍 指向 发 送 erase 消 息 前 它 所 指向 的 相同 的 项 。 
现在 假设 对 向 量 vec 有 相同 的 情况 ， 发 送 消息 


vec.erase(itr1 y 
那么 itr2 将 不 再 指向 发 送 erase 消 息 前 它 所 指向 的 项 。 原因 是 向 量 中 的 删除 会 导致 删除 点 之 


后 的 项 的 重新 布置 。 从 双 端 队列 中 删除 也 会 出 现 相 同 的 问题 。 并 且 itr1 也 会 失效 ， 因 为 erase 方 
法 为 itr1 所 在 的 项 调用 了 析 构 器 。 


插入 之 后 的 迭代 器 状态 是 相似 的 。 对 链表 来 说 ， 没 有 项 的 移动 ， PIER (88 02A fr T d 
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6.1.4 list 类 的 字段 和 实现 


在 这 一 季 ， 概 括 描 述 了 标准 模板 库 的 list 类 的 一 个 实现 ( 即 惠普 的 版 本 )。 由 于 C++ 对 效率 
的 关注 ， 使 得 所 有 广泛 应 用 的 实现 ， 包 括 惠 普 的 实现 ， 都 多 少 有 些 复杂 。6.1.6 节 中 将 考 赛 一 
些 人 简单 但 效率 较 低 的 设计 。 
和 惠普 的 实现 中 所 有 其 他 的 模板 类 一 样 ，list 类 的 声明 和 方法 定义 在 相同 的 文件 中 。 最 基 
214| ”本 的 字段 是 length 和 node， 定 义 如 下 : 


template<class T> 
class list { 
protected: 
unsigned length; 


struct list_node 


{ 
list node" next; 
list node* prev; 


T data; // 保存 一 个 项 
y; // list node 


list node* node; 
图 6-1 显 示 了 串 在 一 起 的 链表 节点 ， 就 像 项 链 上 的 珠子 一 样 。 


prev data next prev data next 


图 6-1 在 一 个 list 中 ， 节 点 中 的 每 一 项 还 包括 指向 前 一 个 或 后 一 个 节点 的 指针 


这 里 有 些 不 可 思议 的 是 ， 指 向 一 个 节点 的 指针 包含 标识 符 node， 而 不 是 node_ptr， 但 是 这 
是 所 有 实现 所 共有 的 特点 (可 能 是 因为 其 他 的 实现 都 是 基于 惠普 的 实现 )。 

node 指 向 的 list_node 称 作 头 节点 。 在 头 节点 中 ，data 字 段 是 未 使 用 的 ， 而 且 最 初 ，prev 和 
next 字 段 ” 都 是 指 回头 节 点 自身 的 。 也 就 是 说 ， 缺 省 构造 器 包含 下 面 的 代码 : 

(*node).nextznode; 

(*node).prev=node; 

因此 在 调用 缺 省 构造 器 之 后 ， 有 : 


node prev data next 
| Se]? |e 


o 在 惠普 的 实现 中 ， 给 定 prev 和 next 的 类 型 为 void*， 因为 list_node* 只 有 对 缺 省 构造 器 才 是 正确 网 。 而 因为 采 
用 了 缺 省 构造 器 ， 所 以 可 以 代入 list_node*， 
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在 一 个 非 空 链 表 中 , 头 市 点 的 next 字 段 指 向 链表 的 第 一 项 ，prev 字 段 指 向 链表 的 最 后 
因此 链表 的 存储 就 像 一 个 环 ， 双 向 链表 。 例 如 ， 图 6-2 是 有 两 个 sting 项 的 链表 容器 。 


node 一 
E eI 


length — 


图 6-2 有 两 个 项 “cat” 和 “duck” 的 链表 。 每 个 项 存储 在 一 个 也 有 Prev 和 next 字 段 的 结构 中 


使 用 链 来 连接 链表 节点 是 第 2 章 中 Linked 类 所 包含 的 概念 ， 但 是 这 里 的 每 个 节点 除了 next 
指针 还 有 prev 指 针 ， 并 且 还 包含 一 个 头 节点 。 

在 学 习 一 些 list 方 法 的 定义 之 前 ， 需 要 说 一 下 典 入 的 iterator 类 。 这 个 类 有 两 个 受 保护 成 员 : 
一 个 字段 和 一 个 构造 器 : 

protected: 

list node* node; 
iterator(list node* x):node(x)4) 

这 个 构造 器 头 有 一 个 构造 器 初始 化 部 分 : —T+ BEI EBUSHDE SA RUE EB I 
始 化 。 每 个 字段 的 初始 化 由 字段 标识 符 和 圆 括号 中 的 初始 值 组 成 。 这 样 做 的 结果 是 node 字 段 
锌 初始 化 成 x。 实 际 上 ， 不 用 初始 化 部 分 也 可 以 实现 这 个 结果 ， 可 以 在 构造 器 定义 里 将 x 赋值 
$+ node? 。 注 意 这 是 iterator 类 的 node 字 段 ， 而 不 是 list 类 的 node 字 段 。 

构造 器 是 protected 的 原因 是 ， 普 通用 户 对 list_node 将 一 无 所 知 ， 因 此 没有 理由 调用 这 个 
构造 器 。 这 里 有 一 个 缺 省 构造 器 ， 它 是 public 的 。 iterator hA public Js PRRUXE 3 ABE 8; 
TE. flan, 


public: 
iterator( ) { } 


T& operator*( ) const { return(*node).data;) 


iterator& operator++ ( ) 
{ 
node = (*node).next; return “this; 


} 





e BRCKADESIBAGZ NAA TR RT 那么 构造 器 初始 化 部 分 就 是 必须 的 。 例如 ， 可 
能 有 : 
class D{ 
public: 
D(int i): v(i(cout««v««endl;) 
protected: 
very long int v; 
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iterator operator+ + (int) 
{ 


iterator tmp = "this; + + "this; return tmp; 


} 


实验 15 有 更 多 关于 iterator 类 的 细节 。 

现在 可 以 考虑 list 的 方法 。 将 定义 8 个 方法 : begin. end, insert, push front, push back, 
erase (有 一 个 参数 )、pop_front 和 pop_back。 正 如 在 图 6-2 中 所 看 到 的 ， 最 后 的 list_node 的 next 
字段 指 问 头 市 点 。 也 就 是 说 ， 头 节点 是 链表 中 最 后 的 list_node 的 下 一 个 节点 。 由 此 可 知 ，list 
类 中 的 end 方 法 返回 位 于 头 节点 的 迭代 器 。 下 面 是 定义 : 

iterator end()(return node;} 

后 面 的 事情 就 有 些 奇怪 了 。 返 回 值 是 node ， 即 指向 头 节点 的 指针 。 但 是 end 方 法 的 返回 类 
型 症 iteratorl 迄 代 器 有 一 个 指针 字段 (也 称 作 node ), 但 是 迭代 器 是 一 个 对 象 而 不 是 一 个 指针 ，。 
在 C++ 中 ， 如 果 遇 到 一 个 类 型 不 匹配 的 表达 式 ， 那 么 可 能 的 情况 下 ， 编 译 器 将 执行 一 个 匹配 
类 型 的 目 动 类 型 转换 。 在 这 个 情况 下 ， 类 型 list_node* 需 要 转换 成 iterator 类 型 。 并 且 由 于 有 
protected 构 造 器 ， 类 型 强制 转换 可 自动 执行 ， 在 前 面 的 iterator 类 中 可 以 看 出 这 一 点 : 

iterator(list node* x):node(x)() 

因此 end 方 法 真正 返回 的 不 是 list 类 的 node 字 段 的 拷贝 ， 而 是 从 list 类 node 字 段 构造 的 一 个 

正如 图 6-2 所 示 ，begin 方 法 应 当 返 回 一 个 迭代 器 ， 它 位 于 头 节 点 的 next 字 段 指向 的 
list_node， 即 包含 链表 中 第 一 个 项 的 list_node。begin 方 法 的 定义 中 也 使 用 了 自动 类 型 转换 : 

iterator begin(){return(*node).next;} 


现在 来 处 理 insert 方 法 : 


iterator insert(iterator position, const T& x); 


这 个 方法 在 list_node 中 存储 了 项 x， 并 调整 了 一 些 next 和 prev 指 针 字 段 ， 使 得 这 个 list_node 
位 于 和 迭代 器 position 所 在 的 list_node 的 前 面 ， 然后 返回 位 于 新 插入 节点 上 的 迭代 器 。 
图 6-4 显 示 了 在 图 6-3 的 链表 pets 上 运行 下 述 消 息 的 作用 : 


pets.insert(itr,"dog"); 


通过 图 6-4 得 出 的 重要 认识 


在 一 个 list 容 器 中 执行 插入 时 ， 没 有 项 被 重新 安排 ， 


pets.node SD 
TEEGA e 


pets.length position.node 


2 





图 6-3  F6-2 AY BE Re rp ix RE position fh ZEAlist_nodefi > “duck” 
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pets.node 


position.node 


^ pets.length | | ~ [d | 7 
EN 


图 6-4 插入 “dog” 之 后 图 6-3 的 链表 情形 


通过 图 6-4， 可 以 推断 实现 insert 方 法 的 步骤 如 下 : 

1) 为 tmp 所 指向 的 list_node 分 配 空间 。 

2) 在 tmp 的 数据 字段 中 存储 项 x。 

3) 为 tmp 的 next 字 段 (更 专业 地 说 ， 是 tmp 指 向 的 link_node 的 next 字 段 ) 赋值 
position.node, | 

4) 为 tmp 的 prev 字 段 赋 值 position.node 指 向 的 link_node 的 prev 字 段 的 值 ，。 

5) 将 position.node 指 向 的 list_node 的 prev 字 段 指 向 的 link_ node 的 next 字 段 赋值 为 tmp。 

6) 将 position.node 指 向 的 link node 的 prev 字 段 赋值 为 mp， 这 个 赋值 必须 在 第 4 步 和 第 5 步 
之 后 进行 。 

7) 增加 长 度 。 

8) 返回 tmp。 

根据 这 个 观点 ， 可 以 提供 insert 方 法 的 大 部 分 定义 。 例如 ， 第 4 步 可 以 写成 : 

(*tmp).prev=(*position.node).prev; 

但 是 定义 也 可 能 用 下 面 语句 实现 步骤 1: 


list_node *tmp=new list _node; 


这 大 有 效 的 ， 但 效率 低 。 首 先 ， 每 个 list_ node 有 相同 的 大 小 ， 但 是 通用 堆 管理 器 不 能 利用 
这 种 一 致 性 。 依 赖 于 计算 机 系统 ， 每 次 调用 new 运 算 符 将 产生 一 个 中 断 ， 而 且 这 些 重复 的 中 
断 将 大 大 降低 项 目的 运行 速度 。 


吉普 的 实现 采用 的 方法 是 list 站 二 二 二 它 自己 的 内 存 管理 例 程 ，get_ node 分 配 链表 节点 ， 
put_node 回 收 空间 。 因而 insert 的 定义 为 : 


iterator insert 1 (iterator position, const T& x) - 
{ | | 
list node* tmp = get node( ); 
construct(value_ allocator. address((*tmp) data), X); 
(*tmp).next = position.node; 
("tmp).prev = (*position.node). prev; 
(* ('position.node).prev)).next = tmp; 
(*position.node).prev = tmp; 
+ +length; 
return tmp; 


bho 
oO 
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实验 15 中 讲述 了 get_node 方 法 的 细节 ，6.1.5 节 探索 了 链表 存储 的 基本 要 素 。 为 了 对 1list 类 
的 实现 有 一 个 完整 的 评价 ， 应 当 细 读 编 译 器 的 list 类 的 实现 中 的 实际 代码 。 它 和 这 里 显示 的 实 
现 可 能 很 相似 。 

push_front 和 push_back 方 法 的 定义 是 单行 的 : 


void push_front(const T& x) { insert(begin( ), x); } 
219 void push back(const T& x) ( insert(end( ), x); ) 


因为 有 头 节 点 ， 所 以 每 个 链表 节点 有 一 个 前 向 和 后 向 节点 ， 并 且 它 简化 了 播 入 和 删除 。 

这 两 个 定义 这 么 简单 说 明了 使 用 头 节点 的 美妙 之 处 : insert 方 法 可 以 处 理 前 向 播 入 ， 也 可 
以 处 理 后 向 插入 ! insert 方 法 总 是 将 新 的 项 (在 一 个 链表 节点 中 ) 插入 到 两 个 链表 节点 之 间 。 
对 于 push_front 方 法 ， 项 被 插 和 到头 节点 和 首 节点 之 间 。 对 于 push_back 方 法 ， 项 被 插 和 人 到 中 
节点 和 头 节 点 之 间 。 

还 需要 定义 三 个 方法 : erase、pop_front 和 pop_back。 但 是 一 旦 定义 了 erase 方 法 ， 
Pop_front 和 pop_back 方 法 的 定义 很 容易 就 可 以 得 到 (这 仍 是 受 ix TKPA). ff Hinsert77 iX; 
可 以 将 一 个 新 的 项 (在 link_node 中 ) 添加 进 链表 。erase 方 法 从 链表 中 去 除 一 个 项 。 图 6-5 显 示 
了 有 三 个 项 的 链表 ， 并 且 有 一 个 迭代 器 位 于 其 中 一 项 上 。 

为 了 从 pets 中 删除 项 “dog”， 基 本 需要 两 个 步骤 : 

1) 将 cat 的 list_node 的 next 字 段 改 为 指向 duck 的 list_node。 

2) 将 duck 的 list_node 的 prev 字 段 改 为 指向 cat 的 list_node。 

执行 这 两 个 步 最 的 情形 如 图 6-6 所 示 。 


pets.node 












position.node 
pets.length 


3 


图 6-5 将 图 6-4 中 有 三 个 项 的 链表 整理 后 的 情形 


pets.node 


ubt AE E E Ded Ny 


position.node 





pets.length 
2 


图 6-6 在 图 6-5 的 链表 中 去 除 “dog” 之 后 


还 需要 考虑 一 些 内 务 处 理 : 必须 为 string 对 象 “dog” 调 用 析 构 器 ， 回 收 包含 "dog" fy 
220| link_node 的 空间 ， 并 削减 length 字 段 。 下 面 是 定义 : 
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("(Cposition.node).prev)).next = (*position.node).next; 
(“((*position.node).next)).prev = ('position.node).prev; 
destroy(value_allocator.address((“position.node).data)); 
put_node(position.node); 
— —length; 

} 


6.1.5 节 将 解释 put_node 方 法 是 如 何 回收 被 删除 节点 的 空间 的 。 
pop_front 方 法 删除 pegin0 位 置 上 的 项 ，pop_back 方 法 删除 endO 前 一 个 位 置 的 项 : 


void pop front( ) ( erase(begin( }); } 


void pop back( ) 

{ 
iterator tmp = end( ); 
erase(— —tmp); 


) 
在 list 类 的 实现 中 ， 我 们 最 后 所 要 学 习 的 是 链表 节点 的 分 配 和 回收 。 
6.1.5 list 节 点 的 存储 


6.1.4 市 介绍 了 insert 方 法 调用 get_node 方 法 返回 指向 保存 插入 项 的 节点 的 指针 的 情况 。 实 
验 15 讨 论 了 get_node 方 法 的 定义 ， 但 是 为 了 使 这 个 讨论 有 意义 ， 需 要 学 习 链 表 节 点 是 如 何在 
储 的 。 

在 链表 中 进行 第 一 次 插入 时 ， 分配 一 大 块 内 存 一 一 通常 是 1KB。 这 个 块 ， 称 作 缓 冲 区 ， 用 
来 进行 连续 的 插入 ， 直 到 填 满 缓冲 区 (这 里 将 忽略 缓冲 区 满 的 情况 以 及 删除 如 何 适 合 这 种 表 
示 )。 为 了 判断 何 时 填 满 缓冲 区 ，list 类 包含 了 一 个 next_avail 字 段 一 一 指向 下 一 次 插入 将 使 用 
的 节点 ， 以 及 一 个 last 字 段 一 一 指向 缓冲 区 末尾 的 下 一 个 节点 : | 

list node* next avail; 

list node" last; 

图 6-7 说 明了 包含 四 个 项 一 一 “cat”、 “dog”, “duck”, “lion” 一 一 的 一 个 list 对 象 ，pets。 

无 论 何 时 分 配 一 个 新 节点 ， 也 不 管 这 个 分 配 是 针对 insert、push_front、push_back 中 的 哪 
一 个 执行 的 ， 都 要 使 用 next_avail 字 段 。 例 如 ， 图 6-7 中 push_back 的 调用 将 调整 next_avail 的 链 
表 节 点 的 prevr 和 next 字 段 ， 使 得 该 链表 节点 的 prev 字 段 将 指向 “lion” 链 表 节 点 ， 而 它 的 next 
字段 将 指向 头 节点 。 然 后 将 增加 next_avail 自 身 。 例 如 ， 图 6-8 显 示 了 在 图 6-7 所 示 配 置 中 下 面 
语句 的 作用 : 

pets.push_back("monkey"); 


这 里 还 需要 再 考虑 两 个 细节 : 当 缓冲 区 耗 尽 时 怎么 办 ? 删除 节点 后 会 怎么 样 ? 当 缓 冲 区 
已 满 ， 也 就 是 当 next_avail=last 时 ， 就 分 配 一 个 相同 大 小 的 新 缓冲 区 。 为 了 跟踪 全 部 的 链表 组 
冲 区 (以 便 在 废弃 链表 时 可 以 回收 缓冲 区 )， 在 list 类 中 包含 了 一 个 buffer_list 字 段 。 这 个 字段 
包含 了 一 个 指向 单 链表 的 指针 ， 它 的 节点 类 型 是 list_node_buffer。 每 个 list_node_buffer 有 两 个 
字段 : 一 个 指向 缓冲 区 的 指针 ， 以 及 一 个 指向 下 一 个 list_node_buffer 的 指针 。 
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图 6-7 buffer 中 存储 的 四 个 宠物 的 链表 
pets.node ( 头 节 点 ) 
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图 6-8 在 图 6-7 中 调用 pets.push_back (“monkey”) 之 后 链表 的 情况 
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struct list node buffer 

{ | 
list node buffer next buffer; 
list node* buffer; 


}; 


list node buffer* buffer. list; 


例如 ， 图 6-9 显 示 了 一 个 分 配 了 三 个 缓冲 区 的 链表 ， 


next 
buffer list buffer buffer 





next avail 


未 用 的 





图 6-9 为 一 个 链表 分 配 的 缓冲 区 。 分 配 了 三 个 缓冲 区 ， 并 且 最 近 分 配 的 缓冲 区 中 仍 有 
fai 未 存储 链表 节点 的 部 分 。 数组 变 量 bufter 指 向 数组 中 的 第 一 个 链表 节点 


最 后 需要 讲 一 下 删除 。 如 果 只 是 把 被 删除 的 节点 遗弃 并 任 其 失效 将 是 很 浪费 的 ， 相反 ， 
甩 用 一 个 节点 链表 保存 曾经 在 链表 中 但 后 来 被 删除 的 节 志 。 这 些 可 反复 利用 的 节点 被 组 织 在 
一 个 单 链表 中 。 这 个 list 类 的 free_ list 字 段 保存 了 指向 ECL BEAD TS oen: 


list node* free_ list: 


EMG WAI prev RR, "DeC EBHEIEE ARGIS S. 那个 节点 的 next 
字段 指向 第 三 个 最 近 被 删除 的 节点 ， 依 次 类 推 ， 空闲 链表 曲折 穿 过 所 有 分 配 的 缓冲 区 。 在 
put_node 方 法 中 将 一 个 被 删除 的 节点 添加 进 空 闲 链表 : 


void put_node(link_type p) 
{ 


p->next = free list; 
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free_list = p; 
} 


例如 ， 从 图 6-8 所 示 的 五 个 宠物 的 链表 中 删除 “duck”， 删 除 之 后 对 链表 的 影响 如 图 6-10 
所 示 。 


node 





图 6-10 ”从 图 6-8 中 删除 “duck” 之 后 的 链表 情形 。“duck” 节 点 
现在 位 于 空闲 链表 的 首 节 点 ， 也 是 惟一 的 节点 


无 论 何 时 发 生 插 和 人 《包括 push_front 或 者 push_back) ， 都 将 检测 空闲 链表 。 如 果 空 闲 链表 
非 空 ， 那 么 将 使 用 它 的 首 节点 进行 插入 操作 ， 并 将 它 从 空闲 链表 中 删除 。 如 果 空 闲 链表 为 空 ， 
222 就 使 用 next_avail 的 节点 ， 除 非 next_avail=last。 如 果 是 那样 ， 将 分 配 一 个 新 的 缓冲 区 并 连接 到 
223| 缓冲 区 链表 的 开头 ， 然 后 把 这 个 新 缓冲 区 的 第 一 个 节点 分 配 出 去 。 
这 些 和 名 种 各 样 的 缓冲 区 和 链表 的 空间 不 会 被 回收 ， 除 非 清除 链表 。 因 此 ， 如 果 应 用 创建 
一 个 大 的 链表 ， 然 后 删除 几乎 全 部 的 项 ， 那 么 所 有 的 链表 空间 仍 被 占用 着 。 
实验 15 还 有 很 多 惠普 的 实现 的 细节 ， 实 验 16 用 一 个 实验 比较 了 向 量 、 双 端 队 列 和 链表 。 
现在 已 经 看 到 了 几 种 类 型 的 迭代 器 一 一 随机 访问 的 和 双向 的 ， 下 面 将 学 习 标准 模板 库 的 迭代 
器 的 组 织 


实验 15: 更 多 list 类 的 实现 细节 (所 有 实验 都 是 可 选 的 ) 


心 
"m 
. 
zl 
P 
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Za] | ”实验 16: 计时 顺序 容器 。 (所 有 实验 都 是 可 选 的 ) 


实验 17: JAR, BOA (所 有 实验 都 是 可 选 的 ) 


像 在 6.1.4 节 中 所 说 的 ， 惠 普 的 实现 中 主要 的 也 是 微妙 的 特点 之 一 就 是 头 节点 。 这 个 节点 





K 175 


ERIT RREME TA BET A EAT A BOR. EP SENT. Ae AE 
它 的 前 面 ， 另 一 个 节点 在 它 的 后 面 。 特 别 是 ， 头 节点 总 是 在 链表 第 一 个 市 把 的 前 面 ， 而 且 也 
总 是 在 链表 最 后 一 个 节点 的 后 面 。 

6.1.6 节 中 考察 list 类 的 其 他 实现 时 将 更 清晰 地 说 明 头 节点 的 优点 。 这 些 实现 比 list 类 的 惠 
普 实 现 要 简单 ， 但 是 效率 低 。 在 编程 项 目 6.2 里 给 读者 提供 了 机 会 去 完成 6.1.6 节 概述 的 一 个 
实现 。 


6.1.6 list 类 的 其 他 实现 


现在 开发 list 类 的 其 他 几 个 实现 。 为 了 简单 起 见 ， 将 依靠 new 和 delete 运 算 符 的 堆 管理 器 实 
现 分 配 和 回收 链表 节点 。 第 2 章 的 单 链 接 Linked 类 怎么 样 呢 ? 这 里 是 Linked 类 中 的 字段 : 


protected: 
struct Node 
{ 
T item; 
Node* next; 
y; // 结构 Node 
Node* head; 


Node*" tail; // 这 个 字段 是 在 实验 8 中 加 入 的 
long length; 


能 否 扩充 Linked 类 ， 使 它 满足 list 类 所 有 的 方法 接口 呢 ? 这 个 问题 还 伴随 着 一 些 list 方 法 的 
后 置 条 件 一 一 特别 是 时 间 估 算 。 

例如 ，list 类 的 pop_back 方 法 的 后 置 条 件 没 有 显 式 地 包含 时 间 估 算 。 根 据 约 定 ， 这 意味 着 
该 方法 的 任何 实现 ，worstTime(n) 必 须 是 常数 。 那 么 pop_back 方 法 用 于 图 6-11 的 Linked 容 器 会 
怎样 ? 

pop_back 方 法 将 必须 令 尾 节点 之 前 节点 的 next 字 段 为 NULL。 为 此 需要 一 个 循环 ， 因 此 
worstTime(n) 将 和 n 成 线性 关系 。 这 将 违背 list 类 中 pop_back 方 法 接口 的 常数 时 间 需 求 ; 因此 必 
须 放弃 list 类 的 单 链表 实现 。 

如 末 修 改 Linked 类 ， 令 它 成 为 双向 链接 的 昵 ? 图 6-12 显 示 了 从 图 6-11 所 示 的 三 个 项 的 链表 
改造 过 来 的 结果 。 


head tail 





head a tail 





图 6-12 有 head 和 tail 学 段 的 双向 链 式 容器 


N 
CA 





W 
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这 里 是 字段 定义 : 
protected: 


struct Node 


T item: 

Node’ next; 

Node" prev; 
y; // 结构 Node 


Node* head; 


Node” tail; 
long length; 


缺 省 构造 器 将 简单 地 把 head 和 tail 设 置 成 NULL ，length 设 置 成 0。 但 是 现在 要 密切 注意 
NULL 引 用 。 例 如 ，push_front 方 法 将 有 一 个 空 容 器 的 特殊 情况 。 


void push_front (const T& x) 
{ 
Node* temp_head = new Node; 
(*temp_head).item = x; 
("temp head).next = head; 
(temp head).prev = NULL; 
length * +; 
if (head == NULL) 
{ 
head = temp head; 
tail = head; 
) // if 
else 


( 
("head).prev — temp head; 
head = temp head; 

) // else 


) / 方法 push_front 


需要 对 push_back 做 相似 的 测试 。 对 pop_front 和 pop_back， 将 需要 用 特殊 的 手段 删除 容器 
中 惟一 的 项 。 同 样 ，insert 方 法 将 首先 测试 : 

if(head==NULLIIposition.node==head) 

这 个 实现 的 最 后 一 行 就 是 在 链表 头 尾 插入 和 删除 的 特殊 情况 所 遭遇 的 情形 。 惠 普 的 实现 
通过 一 个 虚 节 点 一 头 节点 ~ 一 避免 了 特殊 情况 ， 这 个 头 节 点 既 在 链表 第 一 个 节点 的 前 面 ， 又 
在 最 后 一 个 节点 的 后 面 。 

如 采 你 参与 了 编程 项 目 6.2， 就 能 够 了 解 双 向 链接 的 头 尾 实现 的 细节 。 这 个 版 本 使 用 了 
new 和 delete 运 算 符 进行 空间 管理 ， 因 此 它 的 效率 比 自 带 内 存 管理 方法 (get_node 和 put_node 
方法 ) 的 惠普 实现 要 低 。 

62 市 中 说 明了 实现 细节 的 本 质 ， 并 观察 了 list 类 的 一 个 应 用 : 一 个 简单 的 文本 编辑 器 。 
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6.2 链表 应 用 : 一 个 行 编辑 器 


开发 一 个 行 编辑 器 来 说 明 1list 类 。 行 编辑 器 是 一 个 程序 ， 它 逐 行 地 操作 文本 。 假设 每 行 中 
至 多 有 75S 个 字符 长 ， 文 本 的 第 一 行 看 作 行 0， 选 定 的 某 一 行 称 作 当前 行 。 每 个 编辑 命令 以 一 个 
$ 标 志 开 始 ， 而 且 只 有 编辑 命令 才 以 $ 开 始 ， 共 有 八 个 编辑 命令 。 这 里 给 出 了 其 中 四 个 命令 ; 
剩余 的 四 个 将 在 编程 项 目 6.1 中 介绍 。 | 

1. $Insert 

随后 的 直到 下 一 条 编辑 命令 之 前 的 每 一 行 都 将 被 插入 到 当前 行 之 后 的 文本 中 。 插 入 的 最 
后 一 行 成 为 当前 行 。 如 果 调 用 $Insert 时 文本 为 空 ， 那 么 插入 的 就 是 文本 中 仅 有 的 行 。 例 如 ， 
假设 文本 为 空 而 且 有 如 下 行 : 

$Insert 

Water, water every where, 

And all the boards did shrink: 


Water, water every where, 
Nor any drop to drink. 


那么 插入 后 文本 将 变 成 如 下 形式 ， 其 中 “>” 指 示 了 当前 行 : 


Water, water every where, 
And all the boards did shrink; 
Water, water every where, 

— Nor any drop to drink. 


表 举 一 个 例子 ,假设 文本 是 : 


Now is the 
>time for 
citizens to come to 
the 
aid of their country. 


那么 序列 
$Insert 


all 
good 


将 导致 文本 变 成 


Now is the 
time for | 
all 
> good 
citizens to come to 
the 
aid of their country. 


2. $Delete k m 
删除 文本 中 行 k 和 mm 之 间 的 每 一 行 ， 包 括 行 k 和 行 m。 如 果 当 前 行 在 这 个 范围 内 ， 那 么 新 的 
当前 行将 是 第 ~-1 行 ， 否 则 ， 当 前 行 和 命令 执行 前 是 相同 的 。 例 如 ， 假设 文本 是 


bo 





3 
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Now is the 
time for 
all 
> good 
citizens to come to 
the 
aid of their country. 


命令 
$Delete 3 5 
将 使 文本 变 成 
Now is the 
time for 
> all 
aid of their country. 


如 果 K 的 值 是 0 并 且 删 除 的 行 中 包括 当前 行 ， 那 么 说 明 删除 之 后 ， 当 前 行 在 所 有 文本 行 的 
前 面 。 因 此 ， 如 果 紧 随 着 出 现 $Insert 命 令 ， 就 将 在 文本 第 一 行 的 前 面 进 行 插入 。 例 如 ， 假 这 
文本 是 


而 命令 是 
$Delete 0 2 
$Insert 

q 


那么 文本 将 变 成 


4 
>u 
a 
r 
k 


在 删除 之 后 插入 之 前 ， 当 前 行 在 所 有 文本 行 的 前 面 。 插 入 在 文本 的 开头 插入 了 两 行 ， 因 
此 当前 行 现在 是 “u”。 适 当 情 况 下 将 输出 下 面 的 错误 消息 : 
*** Error: The first line number > the second. 
*** Error: The first line number < 0. 


*** Error: The second line number > last line number. 
*** Error: The command is not followed by two integers. 


$Line m 


3. 
行 号 是 六 的 行 成 为 当前 行 。 例 如 ， 如 果 文本 是 : 
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Mairzy doats 
an dozy doats 
>an liddie lamsy divy. 


那么 命令 
$Line 0 
将 使 行 0 成 为 当前 行 : 


>Mairzy doats 
and dozy doats 


and liddle lamsy divy. 
命令 
$Line 一 1 


后 面 跟着 $Insert 方 法 时 ， 可 以 在 文本 开头 插入 行 。 如 果 m 小 于 -1 或 是 大 于 文本 最 后 一 行 
的 行 号 将 输出 错误 信息 。 参 阅 命令 2。 

4. $Done 

这 终止 了 文本 编辑 器 的 运行 。 为 了 方便 起 见 ， 我 们 将 输出 最 终 的 文本 。 任 何 非法 的 命令 
将 输出 一 个 错误 消息 ， 比 如 “$End”、“$insert” 或 “?Insert”。 

系统 测试 1 (输入 用 黑体 表示 ) 


Please enter a line: 
$Insert 


Please enter a line: 
This is line zero. 
Please enter a line: 
This is line one. 
Please enter a line: 
This is line two. 
Please enter a line: 


$Line 1 

Please enter a line: 4 
$Insert ( 
Please enter a line: 

This is line 1.5. 


Please enter a line: 
This is line 1.6. 
Please enter a line: 
This is line 1.7. 
Please enter a line: 
This is line 1.8. 
Please enter a line: 
$Delete 1 3 
Please enter a line: 
. $Done . 








180 K6* 


Here is the final text: 


This is line zero. 

This is line 1.7. 
>This is line 1.8. 

This is line two. 


Please press the Enter key to close this output window. 


系统 测试 2 (输入 用 黑体 表示 ) 


Piease enter a line: 
Insert 
*** Error: Not one of the given commands 


Please enter a line: 
$Insert 


Please enter a line: 
a 


Please enter a line: 
b 
Please enter a line: 
$line l 
*** Error: Not one of the given commands 
Please enter a line: 
$Line 2 
*** Error: The line number must be less than the text size. 
Please enter a line: 
$Done 
Here is the final text: 
a 
>b 


Please press the Enter key to close this output window. 


6.2.1 Editor 类 的 设计 


为 了 决定 Editor 类 应 当 包 含 哪些 方法 ， 首 先 要 解决 的 就 是 一 个 编辑 器 必须 做 什么 ”在 给 出 
的 编辑 器 命令 中 ， 很 明显 有 一 些 职责 : 

。 解析 行 ， 判 断 它 是 否 是 一 个 合法 的 命令 。 

“检测 命令 中 的 错误 。 

。 管 理 文本 。 

这 样 就 可 以 开始 了 。parse 方 法 将 解释 读 入 的 行 。 这 个 方法 将 行 作为 它 惟一 的 参数 。parse 
应 当 返 回 什么 ”对 某 些 命令 而 言 ， 如 $Insert、$Delete 和 $Line， 如 宁 不 能 执行 ， 应 当 返 回 一 个 
错误 消息 。 而 对 有 些 命令 来 说 ， 如 $Done， 应 返回 完整 的 文本 。 在 编程 项 目 6.1 中 ， 有 一 个 命 
令 $Print， 它 要 么 返回 一 个 错误 消息 ， 要 么 返回 一 些 文本 。 如 何 区 分 错误 消息 和 文本 呢 ? 根据 
问题 的 规格 说 明 ， 文 本 行 不 能 以 “$” 开 始 ， 因 此 通过 在 任意 错误 消息 前 放置 该 符号 可 以 断定 
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谁 是 什么 。parse 方 法 将 返回 一 个 字符 串 ， 如 果 第 一 个 字符 是 “$” 就 代表 错误 消息 ， 对 $Done 
命令 返回 的 则 是 文本 (对 $Insert、$Delete 和 $Line 命 令 ， 在 没有 错误 时 将 插入 一 行 或 返回 一 个 
7517). | 

command_check 方 法 将 检测 每 条 命令 中 的 错误 ， 并 且 对 这 四 条 命令 中 的 任意 一 条 都 有 一 
个 单独 的 方法 。 下 面 是 方法 接口 : 


/后 置 条 件 : 这 个 Editor 为 空 。 | | 
void Editor(); | 232 


// 后 置 条 件 : 如 果 line 是 一 个 合法 的 命令 ， 那 么 执行 该 命令 并 返回 运行 结果 。 

// 如 果 line 是 将 被 插入 的 行 ， 那 么 就 试 着 插入 并 返回 结果 。 否 则 ， 返 回 命令 
// 非法 错误 消息 。 

string parse(const string& line); 


/后 置 条 件 : 检测 line 中 的 错误 。 如 果 没 有 找到 错误 ， 就 处 理 命令 并 返回 结果 . 
// 人 否则， 返回 一 个 错误 消息 。 
string command_check(const string&line); 


MARR: 如 果 line 不 是 太 长 ， 就 将 它 插 入 这 个 Editor 并 返回 一 个 空 行 。 
Hf 否则 ， 返 回 一 个 错误 消息 。 
string insert_command(const string&line); 


/后 置 条 件 : 如 果 可 能 就 删除 行 K 到 行 m 之 间 的 文本 ， 并 返回 一 个 空 行 ， 
II 否则， 返回 一 个 错误 消息 。 
string delete_command(int k, int m); 


// 后 置 条 件 : 如 果 可 能 ， 将 索引 号 为 m 的 行 设置 成 为 文本 的 当前 行 ， 并 返回 一 个 空 行 。 
II Gul, RBE—-TRRAB. | s | 
string line command(int m); 


/后 置 条 件 ; 完成 编辑 器 的 运行 并 返回 文本 。 
string done_command(); 


在 开始 定义 这 6 个 方法 之 前 ， 必 须 决定 将 使 用 哪些 字段 。 其 中 一 个 字段 将 保存 文本 ， 因 此 
称 它 为 text。 文 本 将 是 一 个 序列 ， 而 且 通 党 需要 在 文本 内 部 进 答 插入 和 /或 昌 除 ， 因 此 text 应 当 
是 list 类 中 的 一 个 对 象 。( 令 人 惊异 ! ) 

为 了 确定 当前 行 ， 可 以 使 用 一 个 整数 字段 currentLiaeNumber , 或 是 一 个 迭代 器 字段 
current。 某 些 指令 (如 $Delete 和 $Line) 操作 行 号 ， 但 十 链表 的 插入 和 删除 需要 选 代 器 ， 因 此 
很 难说 哪 种 更 好 。 这 两 种 情形 如 何 呢 ? 我 们 将 试图 找 出 答案 ， 即使 每 次 插入 和 删除 都 必须 修 
改 这 两 个 字段 。bool 字 段 inserting 将 判断 输入 行 是 被 插入 编辑 器 还 是 被 看 作 一 个 命令 。 所 有 3 
的 字段 都 是 受 保护 的 ， 允 许 子 类 使 用 它们 : 。 mE BEEN 

protected: | 

list<string> text; 
list« string ::iterator current; 


int currentLineNumber; 
bool inserting; 
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下 面 是 两 个 复合 示例 的 依赖 关系 图 : 


current 





Editor 


既然 了 解 了 方法 接口 和 字段 ， 就 可 以 定义 这 些 方法 来 实现 Editor 类 了 。 
6.2.2 Editor 类 的 实现 
缺 省 构造 器 显 式 地 初始 化 除 text 之 外 的 字段 ，text 是 用 它 的 缺 省 构造 器 初始 化 的 。 


Editor::Editor( ) 

{ 
current = text.begin( ); 
currentLineNumber = —1; 
inserting = false; 


} // 缺 省 构造 器 


parse 方 法 决定 了 行 代表 的 是 一 个 命令 还 是 将 被 插入 的 文本 。 如 果 都 不 是 ， 那 么 命令 开始 
FE CS) 将 加 到 错误 消息 前 。 


string Editor::parse (const string& line) 
{ | 
if (line.substr (0, 1) != COMMAND START) 
if (inserting) 
return insert command (line); 
else 
return COMMAND START + 
MISSING COMMAND ERROR + 
COMMAND START; 
return command check (line); 
234 ) // parse 


command_check 消 县 将 命令 和 命令 参数 分 隔 开 并 调用 相应 的 命令 。 对 $Delete 和 $Line 命 仿 ， 
必须 从 命令 行 中 提取 行 号 。 例如 ， 假设 行 包含 


$Line 173 


用 string 方 法 find 确 定 空格 的 位 置 。 子 字符 种 “173” 从 第 一 个 空格 位 置 +1 开 始 ， 并 一 um 
字符 串 的 末尾 。 字 符 串 方法 substr 返 回 这 个 子 字符 串 ， 它 由 string 方 法 c_ str 转 换 成 了 一 个 字符 
数组 。 最 后 ，atoi 函 数 将 数字 字符 数组 转换 成 一 个 整数 。 
string Editor:command_check (const string& line) 


{ 


string command; 








183 


int blank_pos1 = line.find (BLANK), 
blank pos2; 


if (Blank pos! >= 0) // line 至 少 有 一 个 变 元 
command = line.substr (0, blank_pos1); 
else 
command = line; 
if (command == INSERT_COMMAND) 
{ 
inserting = true; 
return BLANK; 
) // $insert 
else 
{ 
int k, 
m; 


inserting — false; 


if (command == DELETE COMMAND) 
{ 
// 查找 k 和 m 
if (blank_pos1 >= 0) 
{ 
blank_pos2 = line.find (BLANK, biank -Pos + 1); 
if (blank_pos2 >= 0) 
{ 
ck = atoi (line.substr (blank post + 1, 
blank pos2 — blank pos! — 1).c str( )); 
= atoi (line.substr (blank pos + 1).c_str( » 
return delete command (k, m); 
} / 给 定 了 2 个 行 号 
return COMMAND_START + 
MISSING_NUMBER_ERROR; 
)/ 至 少 给 定 了 1 个 行 号 
return COMMAND START + 
TWO NUMBERS ERROR; 
) // $Delete 
else if (command == LINE COMMAND) 
{ 
/ 查找 m | abt 
if (blank_pos1 >= 0) n 
{ 
= atoi (line.substr (blank_pos1 + 1):c_str( » 
return line command (m); | 
) // 给 定 行 号 
return COMMAND START + MISSING. NUMBER ERROR; 
) // $Line | | 
else if (command == DONE. COMMAND) 
return done command( ); 








184 POE 





return COMMAND_START + ILLEGAL_COMMAND_ERROR; 
} / 不 是 一 个 插入 命 


) // command check 


最 后 ， 开 始 实质 性 的 工作 一 一 管理 list 对 象 text。 花 费 常 数 时 间 的 insert_command 方 法 检测 
一 行 是 否 太 长 ， 如 果 不 是 ， 就 将 line 插 入 到 当前 行 之 后 的 文本 中 : 


string Editor::insert_command (const string& line) 
{ 
if (line.length( ) > MAX LINE LENGTH) 
return COMMAND START + LINE TOO LONG ERROR; 
current = text.insert (+ -- current, line); 
currentLineNumber-+ +; 
return BLANK; 
) // insert 


wo une H EMIRO EHR. WARK > 0， 从 文本 开头 的 迭代 器 first 开 始 ， 

后 k 次 增加 first。 然 后 删除 文本 中 的 后 m-k 个 项 。 这 个 循环 之 后 ， 需 要 修改 current 和 
ee 注意 ， 如 有 没有 currentLineNumber 字 段 ， 那 么 决定 是 否 修改 current 将 是 
有 点 困难 的 。 下 面 是 delete_command 方 法 的 定义 : 


string Editor::delete_command (int k, int m) 
{ 
if (k < 0) 

return COMMAND START + FIRST TOO SMALL. ERROR; 
if (m »— (int)text.size( )) 

return COMMAND. START + SECOND TOO LARGE ERROR; 
if (k > m) 

return COMMAND START + 

FIRST GREATER THAN SECOND ERROR; 


list string ::iterator first = text.begin( ); 


for (int i = 0; i < k; i++) 
first+ +; 


for (int i = k; i <= m; i++) 
text.erase (first+ +); 


if (currentLineNumber >= k && currentLineNumber <= m) 
{ 

currentLineNumber = k — 1; 

current = — —first; 
) // if 
else if (currentLineNumber > m) 

currentLineNumber 一 = m + 1 — k ; // current 未 改变 
return BLANK; 
) // delete command 


delete command EE $8 & Kit ja]? 用 nn 代 表 text 中 的 和 了 数 。 最 坏 情况 下 ，k=0 且 m=mnr-1， 4 
就 是 说 将 删除 每 一 行 ， 每 每 次 erase 调 用 将 花费 常数 时 间 ， 因此 worstTime(n) 和 n 成 线性 关系 。 平 
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均 情 况 下 ，m 的 数值 大 约 是 mn/2， 因 此 选 代 次 数 以 及 averageTime(n) 也 和 n 成 线性 关系 。 
line_command 是 增加 还 是 减 小 当前 行 号 ， 这 依 驴 于 currentLineNumber 和 7 的 关系 : 


string Editor::line_command (int m) 
{ 
if (m < —1) 
return COMMAND, START + FIRST TOO SMALL. ERROR; 
if (m >= (int)text.size( )) 
return COMMAND START + FIRST. TOO LARGE. ERROR; 
if (currentLineNumber < m) - 
( 
for (int i = currentLineNumber; i < m; i++) 
current+ +; 
currentLineNumber = m; 


)/ if 
else 
{ 
for (int i = currentLineNumber; i > m; i--) 
current — — ; 
currentLineNumber = m; 
) // else 


return BLANK; 
)// line command 


| 令 P 代 表 文 本 的 行 数 。 在 最 坏 情 况 下 ，currentLineNumber=- 1 H m=n-1, current Kk (C if 
过 text 的 每 一 行 ， 因 此 worstTime(n) 和 nn 成 线性 关系 。 平均 情况 下 ，currentLineNumber 和 mm 之 间 
的 距离 大 约 是 /2， 因 此 平均 迭代 次 数 以 及 averageTime(n) 仍 和 n 成 线性 关系 。 
done_command 方 法 将 返回 文本 ， 包 括 当 前 行 标志 : 


string Editor::done_command( ) 
{ 
const string FINAL_MESSAGE = “Here is the final text: \n"; string 
text string = FINAL MESSAGE; 


If (currentLineNumber == — 1) 
text string += " >\n": 
for (list<string>-::iterator itr = text.begin( ); itr != text.end( ); itr+ +) 
If (itr == current) | 
text. string += ">" + *itr + n": 
else 
text string += *“ + *itr + '\n"; 
return text string; 
} // done command 


XX Fy ROGA FOR et IAEA — £1. DilbworstTime(n). averageTime(n) 都 和 n 成 线性 关系 。 

main 函 数 处 理 行 编辑 器 应 用 中 所 有 的 输入 和 输出 。 | 

main PE X. f —^-EditorxfSreditor, WE 为 输入 的 每 一 行 调用 editor.parse(line)。 返回 
的 结果 中 如 果 有 打头 的 “$” 就 把 它 去 掉 ， 然后 输出 。 输 入 一 行 表 示 一 个 问题 。 提 取 运 算 符 >> 
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可 以 用 来 读 和 人 一 个 命令 ， 但 是 我 们 并 不 清楚 这 时 的 行 是 否 还 包含 行 号 ， 比 如 $Delete 和 $Line 命 
令 中 就 有 行 号 。 它 是 由 没有 输入 语句 的 Editor 类 的 方法 决定 的 。 因 此 需要 main 函 数 中 读 人 一 整 
行 。C++ 提 供 了 getline 函 数 实现 这 个 目的 。 锁 数 接口 是 : 


BRR: 从 isStream 中 去 掉 开头 的 空白 字符 ， 从 当前 字符 到 "\n' 都 被 存 入 一 行 。 
istream& getline(istream& inStream,string& line); 


然后 Editor 方 法 可 以 再 细 分 此 行 。 
下 面 是 定义 ， 使 用 了 一 个 do 循环 来 保证 在 循环 终止 前 输出 SDone 命 令 的 结果 。 


int main( ) 
{ 
const string PROMPT = "Please enter a line: "; 
const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


Editor editor; 
string result; 


string line; 


do 
{ 
cout << PROMPT<< endl; 
getline (cin, line); 
result = editor.parse (line); 
if (result.substr (0, 1) != COMMAND START) 
cout << result << endl << endl: 
else 
cout << result.substr (1) << endl << endi; 
) // do 
while (line !— DONE COMMAND); 
cout << CLOSE WINDOW PROMPT; 
cin.get( ); 
return 0; 
) // main 


这 里 为 文本 的 每 一 项 进行 一 次 do 循环 迭代 (还 有 其 他 的 循环 迭代 )。 因 此 worstTime(n) 至 
少 是 和 成 线性 关系 。 要 获得 更 好 的 估算 ， 需 要 了 解 命令 序列 。 


不 改变 Editor 类 ， 也 可 以 将 程序 修改 为 接收 文件 输入 并 向 文件 发 送 输出 。 下 面 是 修改 后 的 
main ER RX , 


int main( ) 
( 
const string IN PROMPT = "Please enter the path for the input file: "; - 


const string OUT PROMPT = 
"Please enter the path for the output file: "; 


const string ECHO = "The line was: ": 
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const string CLOSE WINDOW PROMPT - 
"Please press the Enter key to close this output window."; | 239 


Editor editor; 
string result; 


string inFileName, 
outFileName, 
line; 


fstream inFile, 
outFile; 


cout << IN. PROMPT; 

cin >> inFileName; 

cout «« OUT. PROMPT; 

cin >> outFileName; 

inFile.open (inFileName.c. str( ), ios::in); 
outFile.open (outFileName.c. str( ), ios::out); 


do 
{ 

getline (inFile, line); 

outFile << ECHO << line << endl: 

result = editor.parse (line); 

if (result.substr (0, 1) !- COMMAND _ START) 

outFile << result << endl << endl: 

else | IEEE EMEN 
outFile << result.substr (1) << endl << endl: 
) // do | 
while (line !— DONE -COMMAND); 
outFile.close( y | 


cout «« CLOSE WINDOW. PROMPT: 
cin.get( ); 
return 0;. 

) // main 


pn HB S FDA RM. 
总 结 


本 章 的 焦点 是 list 类 。 链 表 是 顺序 容器 ， 它 缺 乏 像 向 量 和 双 端 队列 那样 的 随机 访 间 能力。 
但 是 它 的 内 部 插入 和 删除 只 花费 常数 时 间 一 一 而 在 向 量 和 双 端 队列 中 是 线性 时 间 ，。 保持 这 个 
常数 时 间 特 性 是 因为 ， insert 和 erase 方 法 需要 一 个 位 于 插入 或 删除 位 置 的 选 代 器 参数 。 
一 个 简单 的 行 编辑 器 应 用 程序 利用 了 list 类 的 能 力 ， 因此 可 以 快速 地 在 链表 的 任何 位 置 进 
行 多 个 插入 和 删除 。 


习题 
6.1 a. 假设 有 如 下 定义 : 
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list<Char> letters; 
list<char>::iterator itr; 


给 出 发 送 下 面 的 每 条 消息 之 后 链表 中 的 字符 序列 : 


itr = letters.begin( ); 
letters.insert (itr, ‘f); 
letters.insert (itr, 'e'); 
itr+ +; 
letters.insert (itr, 'r'); 
itr-- +; 
itr +; 
letters insert (itr, t); // Hint: we now have e,r,f,t 
letters.insert (itr, 'e'); 
letters.erase (letters.begin( )); 
itr——; 
itr— — ; 
letters.insert (itr, 'p'); 
itrt +; 
letters.insert (itr, 'e'); 
itr — letters.end( ); 
itr 一 一 ; 
letters.insert (itr, ‘c’); 
b. 编写 代码 输出 a 部 分 中 letters 的 最 终 内 容 。 
c. 重 做 a 部 分 ，letters 用 字符 数组 取代 一 串 字 符 。 
d. 重 做 a 部 分 ，letters 用 字符 串 取代 一 串 字 符 。 
e. 重 做 a 部 分 ，letters 用 字符 向 量 取代 字符 串 。 
f. 重 做 a 部 分 ，letters 用 字符 双 端 队列 取代 字符 串 。 
6.2 根据 访问 、 揪 入 和 删除 的 大 0 时 间 比 较 链表 和 向 量 以 及 双 端 队列 。 
241 63 下 面 再 看 一 下 图 6-4 中 的 链表 ， 求 在 该 表 上 执行 下 列 消息 的 影响 ; 


pets.node 







pets.iength 
3 


list<string>::iterator position = pets.begin( ); 
pets.push front( bunny"): | 
pets.erase (position); 

pets.push back ('frog"); 


6.4 癌 量 、 双 端 队 列 和 链表 中 ， 哪 一 个 能 够 提供 更 快速 的 very_long_int 类 实现 ?9 为 什么 ? 
6.5 假设 list 类 利用 了 堆 管 理 器 一 一 使 用 new 和 delete 运 算 符 进 行内 存 分 配 和 回收 。 定 义 
insert 方 法 和 有 一 个 参数 的 erase 方 法 。 
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6.6 在 Editor 类 的 delete_command 方 法 中 ， 变 量 k 和 m 是 int 类 型 的 。 为 什么 当 k 类 型 是 


unsigned 时 会 发 生 错 误 ? 


6.7 假设 myList 是 一 个 list 对 象 ， 其 项 的 类 型 是 double。 编 写 代码 以 反 序 输出 项 。 


6.8 下 面 再 看 一 下 图 6-10: 


AT "m 
— [ua [as 


LI 
L| [OH recon 


如 果 从 这 个 链表 中 删除 “lion”， 下 面 节 点 的 next 字 段 将 指向 哪里 : 
a. 包含 “cat” 项 的 节点 ? 

b. 包含 “dog” 项 的 节点 ? 

c. 包含 “duck” 项 的 节点 ? 

d. 头 节点 ? 


提示 “被 删除 的 节点 成 为 空闲 链表 的 第 一 个 节点 。 


6.9 如 末 list 类 的 设计 中 包含 head 和 tail 字 段 ， 那 么 通过 把 链表 连 成 环 ， 可 以 避免 每 个 链表 
点 的 prev 和 next 字 段 出 现 NULL 值 。 也 就 是 说 ， 在 一 个 非 空 链表 中 ， 头 节点 的 prev 字 
段 将 指向 尾 节点 ， 而 尾 节点 的 next 字 段 将 指向 头 节点 。 将 这 个 设计 应 用 在 begin、 end 


和 push_front 方 法 的 实现 上 有 什么 影响 ? 
编程 项 目 6.1: 扩展 Editor 类 


扩展 Editor 类 ， 使 它 包 含有 下 面 接口 的 方法 (6.2 节 已 介绍 了 4 个 命令 ): 
5. $Change 
WX 9b Y 9b 
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在 当前 行 中 ， We Em ae RATT, 例如 ， 假 设 当前 


行 是 
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bear ruin'd choirs,wear late the sweet birds sang | 

那么 命令 

$Change 

Year Pare % 

将 使 当前 行 变 成 

bare ruin’d choirs,ware late the sweet birds sang 
WRB AC HA aS 

$Change 

Yowa%whe% 

将 得 到 | D. m 

bare ruin'd choirs,where late the sweet birds sang | 

注意 

1) 如 朱 X 或 了 包含 一 个 百 分 号 ， CAP AEB ORT 例如 ， 
$Change 

#0 .16#16%# 

2) Y 给 定 的 字符 串 可 能 是 一 个 空 电 。 例如 ， AUR 74 前 行 是 


ald of their country. 


那么 命令 
$Change 
Hof_M% 
将 当前 行 修改 成 
aid their country. 
3) 如 有 果 分 隔 符 出 现 次 数 小 于 3 ， 将 输出 如 下 的 错误 消息 : 
***Error:Delimiter must occur three times. 
6.$Last — EE 
将 输出 文本 最 后 一 行 的 行 号 。 例 她 ， 如 果 文 本 是 。 
I heard a bird sing . | EE i 
»in the dark of December. 
A magical thing | 
and a joy to remember. c0 0 iW 
那么 命令 
$Last 
将 输出 3。 文 本 和 当前 行 位 置 保持 不 变 。 
7T.$Printkm |. . ， Si i 5 L s | | 
输出 文本 中 从 行 k 到 行 m 之 闻 (包括 行 [ 和 行 由 ) 的 每 一 行 的 行 号 和 内 容 。 例 如 ， 如 果 文 本 是 
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Winston Churchill once said that 

>democracy is the worst eer yr a E 
form of government 
except for all the others. 


那么 命令 
$Print 0 2 


将 输出 Ves bas 


OWinston Churchill once said that 


+» 


Idemocracy is the worst 
2form of government 


文本 和 当前 行 位 置 保持 不 变 。 正 如 命令 2 一 样 ， 如 果 k 比 m 大 ; 或 是 k 小 于 0 或 m 大 于 文本 最 
后 一 行 的 行 号 ， 那 么 就 输出 一 个 错误 消息 。 
系统 测试 1 (样本 输入 用 黑体 表示 ) 


Please enter a line: 
$insert 


Please enter a line: Tm 
You can fool 


Please enter a line: 
some of the people 


Please enter a line: 


tide 
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Please enter a line: 
$Print 2 2 
2 some of the time, 


Please enter a line: 
$Line -1 


Please enter a line: 
$Insert 


Please enter a line: 
Linceln once said that 


Please enter a line: 
you can fool 


Please enter a line: 
some of the people 


Please enter a line: 
all the time and 


Please enter a line: 
all of the time and 


Please enter a line: 
$Last 


10 | > 


Please enter a line: 
$Print 0 10 


0 Lincoln once said that 
1 you can fool 

2 some of the people 

3 all the time and 

4 all of the time and ENT Am. 
5 You can fool 

6 some of the people 

7 some of the time, 

8 but you cannot foul 

9 all of the peeple 

10 all of the time. 


. Please enter a line: iru 
$Line 5 in. 











Please enter a line: 
$Change % Y 9o y % 


Please enter a line: 
$Print 5 5 


5 you can fool 


Please enter a line: 
$Line 6 


Please enter a line: 


$Change %some %all % 


Please enter a line: 
$Print 6 6 


6 all of the people 


Please enter a line: 
$Line 8 


Please enter a line: 
$Change %ul 6019; 


Please enter a line: 
$Print 8 8 


8 but you cannot fool 


Please enter a line: 
$Line 9 


Please enter a line: 
$Change 9t ee96eo 90 


Please enter a line; 
$Print 9 9 


9 all of the people 


Please enter a line: 
$Delete 3 3 


Please enter a line: 
$Print 0 10 


*** Error: The second line number is greater than the number of lines in the text. 


Please enter a line: 
$Last 
9 


Please enter a line: 
$Print 0 9 


0 Lincoln once said that 


1 you can fool 

2 some of the people 
3 all of the time and 
4 you can fool 

5 all of the people 

6 some of the time, 

7 but you cannot fool 
8 all of the people 

9 all of the time. 
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Please enter a line: 
$Done 


Here is the final text: 
Lincoln once said that 
you can fool 
some of the people 
all of the time and 
you can fool 
all of the people 
some of the time, 
but you cannot fool 

>all of the people 
all of the time. 


Please press the Enter key to close this output window. 


AN (HA ATA BABA ) 


Please enter a line: 
$Insert 


Please enter a line: 
Life is full of 


Please enter a line: 
successes and lessons. 


Please enter a line: 
$Delete 1 1 


Please enter a line: 
$Insert 


Please enter a line: 
wondrous oppurtunities disguised as 


Please enter a line: 
hopeless situations. 


Please enter a line: 
$Last 


2 


Please enter a line: 
$Print 0 2 


0 Life is full of 
1 wondrous oppurtunities disguised 
2 hopeless situations. ` 


Please enter a line: 
$Line 1 


Please enter a line: 
$Change %ur%or% 


Please enter a line: 
$Print 0 2 


0 Life is full of 
| wondrous opportunities disguised as 
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2 hopeless situations. 


Please enter a line: 
$Done 


Here is the final text: 
Life is full of 

> wondrous opportunities disguised as 
hopeless situations. 


Please press the Enter key to close this output window. 250 


编程 项 目 6.2: list 类 的 另 一 种 设计 和 实现 

实现 6.1.6 节 中 描述 的 双向 链表 ， 即 带头 尾 字段 的 list 类 的 设计 。 这 个 项 目 中 仅 需 要 实现 
6.1.1 节 中 给 出 的 前 13 个 方法 。 设 置 一 个 驱动 程序 测试 这 个 实现 。 还 需要 实现 至 少 几 个 迭代 器 
运算 符 :“、!+ 和 ++ (前 加 或 后 加 都 可 以 )。 251 





第 7 章 ”队列 和 堆栈 


本 章 介 绍 了 标准 模板 库 中 另外 两 个 数据 结构 : queue 类 和 stack 类 。 由 于 只 能 以 有 限 的 方式 
访问 或 修改 队 齐 和 堆栈 ， 央 此 它们 每 个 只 有 很 少 的 【 少 于 10 个 ) 方法 接口 ， 而 vector、deque 
和 1list 类 都 至 少 包含 40 个 方法 接口 ; 而 且 这 些 类 的 实现 是 非常 直截了当 的 。 实 际 上 ， 这 些 类 
“ 配 接 ”一 些 基础 容器 类 的 实现 。 例 如 ， 任 何 有 push_back、pop_back、back、empty 和 size 方 
法 的 容器 类 都 可 以 作为 stack 类 的 基础 类 。 队 列 和 堆栈 有 广泛 的 应 用 。 我 们 将 从 queue 类 开始 ， 
因为 它 的 大 部 分 应 用 都 是 通用 的 ， 而 堆栈 主要 是 用 在 计算 机 系统 中 。 


目标 


1) 能 够 定义 队列 和 堆栈 的 特性 。 

2) 理解 queue 和 stack 类 之 所 以 被 称 作 “容器 配 接 器 ”(container adaptor) 的 原因 。 

3) 考察 计算 机 仿真 中 队列 的 作用 。 

4) 考察 递归 的 实现 中 以 及 中 级 表示 法 向 后 组 表示 法 转换 的 实现 中 堆栈 的 作用 。 253 


7.1 队列 


队列 是 项 的 有 限 序列 ， 满 足 : 

1) 插入 只 允许 从 尾部 进行 。 

2) 删除 、 检 索 和 修改 只 允许 从 头 部 进行 。 

队列 中 的 项 是 按照 时 间 排 序 的 : 先入 ， 先 出 。 

队列 中 的 项 是 按照 时 间 排 序 的 : 插入 的 第 一 项 (在 尾部 ) 最 终 将 是 第 一 个 (从 头 部 ) 被 
删除 、 检 索 或 修改 的 项 。 第 二 个 插入 的 项 将 是 第 二 个 被 删除 、 检 索 或 修改 的 项 ， 依 次 类 推 
队列 的 这 个 定义 属性 有 时 被 称 为 “ 先 到 ， 先 服务 ”",“ 先 人 ， 先 出 ”， 或 简称 FIFO。 图 7-1 显 示 
了 经 过 几 次 插入 和 删除 的 队列 。 | l | 

队列 的 示例 有 很 多 ， 如 : 

展示 窗 中 排 成 一 行 的 汽车 。 

排队 等 待 购买 球赛 人 场 券 的 球迷 。 

在 超市 中 等 待 付款 的 顾客 。 | 

在 机 场 等 待 起 飞 的 飞机 。 254 

我 们 可 以 名 名册 放 诈 多 多 队列 的 例子，73 节 将 介绍 计算 机 人 真 领 中 区 的 一 个 应 用 





7.1.1 queue 类 的 方法 接口 | 
和 标准 模板 库 中 其 他 的 容器 类 一 样 ，queue 类 是 一 个 模板 类 : 


template<class T class Container=deque<T>> 


除了 项 的 类 型 T 之 外 ， 队 列 的 每 个 实例 还 包含 一 个 容器 模板 ， 缺 省 为 deque<T>。 这 暗示 
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着 deque 可 以 平均 以 常数 时 间 处 理 队列 的 属性 定义 : 尾部 插入 ， 头 部 删除 和 头 部 访问 。 考 虑 实 
现时 我 们 将 观察 队列 的 这 个 性 质 。 


Brian Jane Karen Bob 
前 项 后 项 
a) 有 4 项 的 队列 





Brian Jane Karen Bob Kim 


前 项 | 后 项 


b) 图 7-1a 中 插入 Kim 后 的 队列 





Jane Karen Bob 


前 项 


c) 图 7-1b 中 删除 Brian 后 的 队列 





图 7-1 经 过 儿 次 插入 和 删除 的 队列 


与 第 5 章 和 第 6 章 的 顺序 容器 类 不 同 ，queue 容 器 类 有 一 个 最 小 接口 。 下 面 是 所 有 方法 的 
RE: 


1. /前 置 条 件 : 用 这 个 Container 的 拷贝 初始 化 队列 。 
explicit queue(const Container&-Container()); 


注意 ”保留 字 explicit 只 能 和 构造 器 一 起 使 用 ， 它 指示 编译 器 不 应 当 在 构造 器 语句 中 
执行 自动 类 型 转换 日 。 也 就 是 说 ， 如 果 提 供 了 构造 器 的 变 元 ， 那么 这 个 变 元 必须 是 
第 二 个 模板 变 元 指定 的 Container 类 的 一 个 容器 对 象 。 例 如 ， 下 面 是 一 些 合法 的 队列 
定义 : 

a. queue<string> q1; 

b. queue<string,deque<string>> q2(q1); 

C. queue<string> q3(q1); 

d. queue<double, listcdouble>> a4; 

e. queue<double, list<double>> q5(q4); 


91、92 和 q3 的 定义 是 等 价 的 ，94 和 95 的 定义 也 是 等 价 的 。 而 下 面 的 两 个 定义 是 不 合法 的 : 
f. queue<string,list<string>> q6(q1); | 
/构造 器 变 元 应 当 是 一 个 list 


O 回 亿 在 第 6 章 的 list 类 的 iterator 类 中 ， 自 动 类 型 转换 将 指针 转换 成 了 选 代 器 。 








. queue<double>>q7(q4); | 

/构造 器 变 元 应 当 是 一 个 deque 255 
. /后 置 条 件 : 如 果 这 个 队列 为 空 就 返回 真 。 否 则 ， 返 回 假 。 

bool empty() const; 
. // 后 置 条 件 : 返回 这 个 队列 对 象 的 项 的 数量 。 


unsigned size() const; 


© 


N 


CO 


4. /后 置 条 件 ; 将 项 Xx 插入 到 这 个 队列 的 尾部 。averageTime(n) 是 常数 。 
// worstTime(n) 是 O(n)， 但 是 对 n 次 连续 插入 ， 全 部 n 次 插入 的 worstTime(n) 
If 只 是 O(n)。 也 就 是 说 ，amortizedTime(n) 是 常数 。 


void push (const value_type& x); 


注意 1 这 个 方法 经 常 被 称 作 “enqueue”( 入 列 )。 


注意 2 typedef 将 T 的 含义 声明 为 value_type。 


5. // 前 置 条 件 : 这 个 队列 非 空 。 

ISTE: 返回 对 这 个 队列 开头 项 的 引用 。 

T& front(); 
注意 因为 返回 值 是 一 个 引用 ， 所 以 这 个 方法 可 以 用 来 修改 队列 开头 的 项 。 例 如 ， 如 
有 果 my_queue 是 一 个 字符 事 非 空 从 列 ， 


my. queue.front()2"Courtney"; 
把 my_ queue 中 存储 的 第 一 项 替换 成 “Courtney”。 


6. /前 置 条 件 : 这 个 队列 非 空 。 

MERE: 返回 对 这 个 队列 开头 项 的 一 个 常量 引用 。 

const T& front(); l 
注意 因为 返回 值 是 一 个 常量 引用 ， 所 以 这 个 方法 不 能 用 来 修改 队列 的 开头 项 。 但 是 
这 个 方法 可 以 获取 开头 项 。 例 如 ， 如 果 my_queue 是 一 个 非 空 队列 ， 


cout<<my_queue.front(); 
将 输出 my_queue 的 第 一 个 项 。 


7. // 前 置 条 件 : 这 个 队列 非 空 。 


/后 置 条 件 : 调用 前 位 于 这 个 队列 开头 的 项 将 从 这 个 队列 中 天 除 
void pop(); 


注意 1 pop 方 法 不 返回 弹出 的 项 。 为 了 获取 这 个 项 ， EA MoO ZAM ton0. 


ho 
cn 
nN 


注意 2 这 个 方法 经 常 被 称 作 “dequeue”( 出 列 )， 注意 不 是 deque" ARRAT). 


8. /前 置 条 件 : 这 个 队列 非 空 。 

/后 置 条 件 : 返回 对 这 个 队列 尾部 项 的 引用 。 

T& back(); | | 
注意 1 队列 的 定义 不 需要 一 个 back 方 法 ， 但 是 标准 模板 库 中 包括 了 这 个 方法 。 


注意 2 这 个 方法 可 以 用 来 修改 队列 中 插入 的 最 后 一 项 。 
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9. // 前 置 条 件 : 这 个 队列 非 空 。 
// 后 置 条 件 : 返回 对 这 个 队列 尾部 项 的 一 个 常量 引用 。 
const T& back(); l 
回忆 前 面 的 约定 : 当 没 有 给 出 时 间 估 算 时 ， 方 法 的 worstTime(n) 就 是 常数 。 因 此 对 除了 
push 之 外 的 所 有 方法 ，worstTime(n) 都 是 常数 。 push; #3 AY worstTime(n) O(n), 但 是 
amortizedTime(n) 是 常数 。 对 queue 类 的 所 有 方法 而 言 ，averageTime(n) 都 是 常数 。 
queue 类 没有 一 个 关联 容器 类 。 为 什么 没有 呢 ?” 因 为 根据 队列 的 定义 ， queue 对 象 中 惟一 
能 被 访问 的 项 就 是 queue 开 头 的 项 。 因 此 ， 如 果 能 获取 任意 一 项 将 违背 queue 的 定义 。( 实 际 上 ， 
back 方 法 就 违背 了 队列 的 定义 )。 
在 7.1.2 节 中 将 看 到 使 用 queue 类 是 很 容易 的 。 


7.1.2 使 用 queue 类 


queue 从 有 很 少 的 方法 ,而且 没 有 近代 器 。 但 这 并 不 意味 着 不 能 输出 队列 、 只 是 需要 做 些 额 
外 的 工作 。 例 如 ， 这 里 有 一 个 程序 生成 图 7-1 所 示 的 队列 。 把 队列 作为 一 个 值 形 参 ，printQueue 
约 数 就 可 以 在 不 破坏 队列 的 前 提 下 ， 输 出 队列 的 拷贝 。 


#include <iostream> 
#include <string> 
#include <queue> 
using namespace std: 


void printQueue (queue<string> names) 
{ 
cout << end! << endl << "Here is the current queue:" << endl: 
while (!names.empty( )) 
{ 
cout << names.front( ) << endl: 
names.pop( ); 
} // while 
) // 函数 printQueue 


int main( ) 
( | | 
const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window. "; 


queue<string> names; 


names.push ("Brian"); 
names.push ("Jane"); 
names.push ("Karen"); 
names.push ("Bob"); 
printQueue (names); 


names.push ("Kim"); 
printQueue (names); 


names.pop( ); 








printQueue (names); 


cout << endl << endl << CLOSE. WINDOW PROMPT; 
cin.get( ); 
return O; 
) // main 
在 主 函 数 main 中 ，printQueue 调 用 中 的 变 元 names 是 不 会 改变 的 ， 但 是 printQueue 方 法 必 
须 对 这 个 变 元 做 一 个 拷贝 。 
正如 读者 可 能 猜想 到 的 ，queue 类 的 实现 是 相当 简单 的 ， 简 单 到 令 人 惊讶 的 地 步 ! 7.1.35 
显示 了 这 些 早已 做 过 的 工作 。 


7.1.3 RRMA 


根据 已 经 了 解 的 标准 模板 库 知识 可 以 推 想 ， 在 满足 给 定 方法 接口 的 前 提 下 ， 编 译 器 的 编 
写 者 能 自由 地 以 任何 方式 设计 和 实现 queue 类 。 情 况 并 不 是 这 样 。 实 际 上 ， queue 类 的 设计 和 
实现 是 标准 模板 库 的 一 部 分 ， 而 不 是 编译 器 编写 者 可 选 的 。 

容器 配 接 器 C 使 用 一 些 基础 的 容器 对 象 定义 C 的 方法 。 

queue 类 是 容器 配 接 器 的 一 个 示例 。 容 器 配 接 器 C 将 一 些 基础 容器 转换 成 类 C 的 容器 。 容 
各 配 接 性 一 queue、stack 和 priority_queue 一 一 与 标准 模板 库 的 其 他 部 分 的 处 理 是 截然 不 同 的 。 
它们 的 方法 定义 必须 调用 基础 容器 类 的 方法 。 

在 queue 类 情况 下 ， 所 有 需要 基础 类 Container 所 做 的 是 它 应 当 支 持 empty、 size, front, 
push_back 和 和 pop_front 方 法 (以 及 back 方 法 )。 例如， 下 面 给 出 了 标准 模板 库 中 queue 类 的 一 
部 分 : 

template <class T, class Container = deque<T>> 

class queue 


{ 
protected: 
Container c; 
public: 
void pop( ) ( c.pop. front( ); } 
const T& front( ) const ( return c.front( ); ) 


作为 queue 类 的 使 用 者 或 实现 者 ， 所 做 的 惟一 选择 就 是 用 什么 作为 基础 容器 。list 类 可以 
作为 基础 类 来 使 用 。 回 想 一 下 ， list 类 中 有 size、 empty、push_back、pop_front、front 和 back 
方法 。 

deque 类 也 可 以 作为 基础 类 ; 实际 上 ，aeque 类 就 是 缺 省 基础 类 。 在 deque 类 的 惠普 实现 中 ， 
size, empty, pop. front, front 和 back 方 法 花费 常数 时 间 。 push_back 方 法 的 averageTime(n) 是 
常数 。worstTime(n) 发 生 在 必须 调整 映射 数组 大 小 时 ， 它 和 n 成 线性 关系 ， 但 是 随后 的 n 次 尾部 
插入 ， 每 次 只 用 常数 时 间 。 也 就 是 说 ， 对 deque 类 中 的 push-_ back 方 法 而 言 ， amoritizedTime(n) 
是 常数 。 

vector 类 不 能 满足 基础 类 的 要 求 : 它 没有 pop_front 方 法 。 这 不 Fe BRE RAR PE Bt EZ 
ra EL, XX ERAS BBR SO g » BEER DMB ILD, worstTime(n) Fi 
n 成 线性 关系 ( 指 所 有 基于 惠普 实现 的 实现 )， 
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如 果 有 一 些 其 他 的 包含 这 些 方法 的 容器 类 ， 可 以 根据 它们 定义 一 个 queue 对 象 。 例 如 ， 只 
需要 稍 做 一 点 工作 ， 就 能 扩展 Linked 类 ， 使 它 满足 配 接 类 的 要 求 ， 详 情 参 阅 习题 7.7。7.1.4 市 
为 队列 容器 配 接 器 开发 了 另 一 个 配 搂 类 。 


7.1.4 一 个 接近 的 设计 


前 面 已 经 提 到 vector 类 不 能 作为 队列 的 基础 类 ， 因 为 vector 类 缺乏 pop_front 方 法 。 另 一 种 
选择 也 是 基于 数组 的 ， 它 直接 操作 数组 字段 ， 使 得 平均 情况 下 的 push_back 和 pop_front 调 用 只 
花费 常数 时 间 。 在 这 个 基础 类 一 一 queueArray 一 一 的 设计 中 有 五 个 字段 : 


T[ ] data; 
unsigned size; 
int head, 

tail, 


max size, // data 中 可 以 存储 项 的 最 大 数量 


data 数 组 保存 项 ，size 保 存 项 的 数量 ，max_size 保 存 项 的 最 大 数量 (在 必须 调整 大 小 之 前 
的 )。 开 头 的 项 总 是 在 下 标 head 处 ， 但 是 head 并 非 总 是 值 0。 基 本 的 ， 发 生 push_back 和 
pop_front 调 用 时 ， 队 列 就 沿 着 数组 data“ 滑 下 ”。head 字 段 包 含 了 data 的 下 标 ， 即 队列 开头 项 
的 下 标 ; 而 tail 字 段 包含 了 队列 尾部 项 的 下 标 。 将 taii 初 始 化 为 -1 表示 队列 为 空 。 图 7-2 显 示 了 
在 这 些 字段 上 调用 push_back 两 次 及 调用 pop_front 一 次 的 作用 。 问 号 表示 了 一 个 未 知 或 不 相关 
的 数值 。 





data[0] data[0] EN 
data(t] data[1] | Bob | 
data[2] data[2] |? | 
data[3] datal3] | ? | 
data[99] data[o9] | ? | 


max size 100 max -size| 100 | max size] 100 | max -size| 100 | 


图 7-2 队列 的 一 个 基于 数组 的 基础 容器 : a) 初始 化 ，b) 调用 push_back("Kay") 之 后 ， 
c) 调用 push_back("Bob") 之 后 ，d) 调用 pop_front(0) 之 后 





= Sak pA uu LII. E E 


图 7-2 有 几 个 吸引 人 的 特点 。 首 先 ， 注 意 在 每 次 push_back 调 用 中 都 要 增加 tail TE 
pop_front 调 用 中 ， 项 并 没有 做 物理 的 (真正 的 ) 移动 。 在 图 7-2d 里 ,， “Kay ”仍然 处 在 data[0]。 
所 有 pop_front 所 做 的 就 是 增加 head， 表 示 队 列 开头 的 项 在 次 高 下 标 上 了 。 但 是 如 果 在 每 次 
push_back 调 用 中 增加 tail， 并 且 在 每 次 pop_front 调 用 中 增加 head， 最 终 将 得 到 图 7-3 所 示 的 四 
个 项 的 队列 。 : 






data[0] 

data[1] 

data[2] 

data[96] 
data[97] 
data[98] 

data[99] 





size 
heac 
tai 
“max size 


图 7-3 队列 中 下 标 96~99 之 间 的 4 项 


data[0] 
data[1] 
data[2] 






data[96] 
data[97] 
data[98] 
data[99] 






Xenia 


size 
head 
Bios 0 c] 
max size 


图 7-4 容器 对 象 gueueArray 中 有 5 项 存在 数组 data 里 : 前 4 项 在 下 标 96~99， 最 后 一 项 在 下 标 0 
如 果 现 在 使 用 push_back 方 法 将 “Jason” 添加 进 队列 会 怎样 呢 ? 容 恬 对 象 queueArray 的 大 
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小 恰好 是 4， 因 此 不 需要 增加 数组 data 的 长 度 。 可 以 将 四 个 项 移动 至 下 标 0 到 下 标 3， 然 后 把 
“Jason” 插 入 到 下 标 4 处 。 但 是 应 当 尽 可 能 避免 移动 项 。 有 没有 留心 另 一 种 选择 ?下 标 0 的 位 
置 是 可 用 的， 所 以 就 把 “Jason” 放 在 那里 。 图 7-4 显 示 了 结果 。 

图 7-4 所 示 的 容器 对 象 gueueArray 是 环形 的 ， 数 组 data 中 下 标 0 位 置 的 项 跟随 着 下 标 99 位 兽 
的 项 。 这 种 安排 需要 习惯 一 下 ， 因 为 有 可 能 得 到 tail<head 的 结果 。 不 过 它 的 美妙 之 处 在 于 ， 
这 样 的 push_back 调 用 只 花费 常数 时 间 。 使 用 相同 的 观点 ， 并 允许 head 从 0 前 进 到 99， 这 样 
pop_front 调 用 也 只 化 费 常数 时 间 。 惟 一 的 非常 数 时 间 操 作 是 当 size=max_size 有 是 调用 push_back 
时 数组 的 扩充 。 在 这 种 情况 下 要 创建 两 倍 空间 的 数组 并 将 旧 的 项 拷贝 到 新 的 数组 里 。 这 花费 
线性 时 间 ， 但 只 是 每 上 次 push_back 调 用 才 发 生 一 次 ， 因 此 amortizedTime(m) 是 常数 ， 所 以 
averageTime(n) ft # AY 


实现 细节 留 到 编程 项 目 7.4。 现 在 看 一 个 包含 多 个 队列 应 用 的 领域 一 计 算 机 仿真 。 
7.2 计算 机 仿真 


模型 一 一 即 系 统 的 简化 ， 使 我 们 能 够 研究 系统 的 行为 。 

系统 是 若干 互相 作用 的 部 件 的 集合 。 人 们 常常 对 研究 系统 的 行为 感 兴趣 ， 例 如， 经 济 系 
统 、 政 治 系统 、 生 态 系统 甚至 计算 机 系统 。 因 为 系统 通常 都 很 复杂 ， 所 以 可 能 需要 使 用 模型 
以 便于 管理 任务 。 模 型 ， 也 就 是 一 个 系统 的 简化 ， 模 型 设计 的 目的 是 为 了 研究 系统 的 行为 。 

一 个 物理 模型 和 它 代表 的 系统 很 相似 ， 只 是 比例 和 强度 不 同 。 例 如 ， 可 能 为 切 萨 皮 页 海 
沈 中 的 灾 汐 运动 或 计划 中 的 购物 中 心 创 建 一 个 物理 模型 。 军 事 演 习 、 春 季 训 练 和 混战 也 是 物 
理 模 型 的 例子 。 不 幸 的 是 ， 使 用 当前 技术 仍 有 一 些 系统 不 能 作出 物理 模型 一 一 至 今 还 有 一些 
物理 本 质 不 能 预期 的 行为 ， 像 天 气 。 通 常 ， 就 像 在 飞行 训练 中 ， 物 理 模型 可 能 太 昂贵 、 太 危 
险 ， 或 者 是 很 麻烦 的 。 

有 时 系统 可 以 表示 成 一 个 数学 模型 : 一 组 针对 系统 的 假设 、 变 量 、 常 量 和 等 式 。 数 学 借 
型 当然 要 比 物理 模型 易于 处 理 。 在 很 多 情况 下 ， 像 距离 = 速度 * 时 间 和 色 股 定理 ， 在 合理 的 时 
间 内 就 能 够 分 析 求 解 等 式 。 但 是 有 时 候 并 不 能 这 样 。 例 如 ， 大 部 分 微分 等 式 不 能 分 析 求 解 ， 
以 及 有 数 千 个 等 式 的 经 济 学 模型 不 能 在 合理 时 间 内 手工 求解 。 

计算 机 模型 使 得 能 有 效 地 模拟 复杂 系统 。 

在 这 样 的 情况 下 ， 数 学 模型 通常 用 一 个 计算 机 程序 表示 。 计 算 机 模型 是 研究 复杂 系统 
( 像 天 气 预报 、 太 空 飞行 和 城市 规划 ) 的 基础 。 计 算 机 模型 的 使 用 称 作 “ 计 算 机 仿真 *。 使 用 
计算 机 模型 比 使 用 原 系统 有 几 个 优点 : 

D 安全 。 飞 行 仿真 器 可 以 用 严重 危险 的 情况 (比如 中 风 和 劫机 等 ) 训练 飞行 学 员 ， 但 没 
有 人 会 受伤 。 

2) 经 济 。 营 业 方针 课程 中 的 仿真 游戏 使 学 生 可 以 管理 一 个 假想 的 公司 ， 与 其 他 学 生意 争 。 
如 果 公 司 “ 破 产 ”， 惟 一 的 代价 就 是 得 到 一 个 低 的 成 绩 。 

3) 高 速 。 计 算 机 通常 能 很 快 地 给 出 预言 ， 使 你 可 以 操作 它们 。 这 个 特点 几乎 是 每 个 仿真 
(从 股票 市 场 到 国防 ) 的 基础 。 





4) 有 灵活。 如 琳 得 到 的 结果 不 符合 所 研究 的 系统 ， 可 以 修改 这 个 模型 。 这 是 反馈 的 例子 - 


O 只 有 一 次 ， 有 一 个 学 员 在 一 个 大 风 雪 条 件 下 引擎 失灵 的 仿真 中 ， 他 惊慌 失措 ， 从 仿真 驾驶 座 答 中 “ 跳 全 ” 
出 来 ， 樟 上 真实 的 地 面 而 扭伤 了 脚 躁 。 
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这 些 好 处 是 很 引 人 注 目的 ， 因 此 计算 机 仿真 成 为 研究 复杂 系统 的 公认 的 方法 。 这 并 不 是 
说 计算 机 仿真 是 所 有 系统 问题 的 万 能 药 。 模 型 化 一 个 系统 需要 简化 ， 因 此 有 必要 提出 模型 和 
系统 的 区 别 。 例 如 ， 假 设 30 年 前 开发 了 一 个 地 球 生态 系统 的 计算 机 仿真 ， 你 可 能 忽略 了 CFC 
(氧气 碳 ) 的 影响 ， 而 实际 上 目前 所 有 的 环境 科学 家 都 相信 CFC 正 严重 地 破坏 着 臭氧 层 。 


发 
系统 — 2 计算 机 模型 


验证 运行 


一 一 一 一 输出 
解释 — 输 


图 7-5 计算 机 仿真 的 反馈 


计算 机 仿真 的 缺点 是 它 的 结果 往往 是 预言 式 的 解释 ， 而 预言 总 是 一 件 冒险 的 交易 。 因 此 ， 
在 计算 机 仿真 结果 的 前 面 总 是 有 如 下 的 声明 : “如 果 变量 之 间 的 关系 与 初始 条 件 和 描述 一 至 
那么 结果 将 可 能 如 下 ……” 


7.3 队列 应 用 : 洗车 仿真 


队列 可 以 用 于 多 种 仿真 。 例 如 ， 下 面 将 阐述 在 Speedo 洗 车 处 的 交通 流动 仿真 中 队列 的 使 用 。 

问题 

给 出 洗车 处 的 到 达 时 间 ， 计 算 每 辆 车 的 平均 等 待 时 间 。 

分 析 

假设 洗车 处 有 一 个 工作 站 ; "E “服务 器 ”。 每 个 车 需 洗 10 分 钟 队列 中 每 次 至 多 有 五 
辆 车 等 待 洗车 。 当 正在 清洗 一 辆 车 并 且 队 列 中 有 五 辆 车 时 ， 如 果 有 一 辆 车 到 达 ， 那么 它 将 作 
为 “溢出 ”不 准 入 内 且 不 计算 在 内 / 

平均 等 待 时 间 是 将 每 辆 车 的 等 待 时 间 加 起 来 再 除 以 车 的 数量 。 结 束 标记 是 999 下 面 是 关 
于 到 达 和 离开 的 详细 情况 : 

1) 如 果 在 同一 分 钟 中 既 有 到 达 的 又 有 离开 的 ， 就 先 处 理 离开 的 车 。 

2) 如 果 当 队列 为 空 且 没有 车 被 清洗 时 ， 到 达 了 一 辆 车 ， 那么 就 马上 开始 清洗 这 辆 车 它 
没有 进入 队列 。 

3) 每 当 一 辆 车 开始 通过 十 分 钟 的 清洗 周期 ， 它 就 离开 队列 并 停止 等 待 

系统 测试 1 (输入 用 黑体 表示 ) 

Please enter the next arrival time. The sentinel is 999. 

1 


Please enter the next arrival time. The sentinel is 999. 
3 ， 


Please enter the next arrival time. The sentinel is 999. 
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5 

Please enter the next arrival time. The sentinel is 999 
8 

Please enter the next arrival time. The sentinel is 999 
8 

Please enter the next arrival time. The sentinel is 999 
15 

departure time = 1] 

Please enter the next arrival time. The sentinel is 999 
999 

departure time = 2] 

departure time = 31 

departure time = 41 

departure time = 51 

departure time = 61 


i 


| 


The average waiting time, in minutes, was 19.3333. 
Please press the Enter key to close this output window. 


系统 测试 2 (输入 用 黑体 表示 ) 

Please enter the next arrival time. The sentinel is 999. 
5 

Please enter the next arrival time. The sentinel is 999. 
5 

Please enter the next arrival time. The sentinel is 999. 
7 


Please enter the next arrival time. The sentinel is 999. 
12 


Please enter the next arrival time. The sentinel is 999. 
12 | 
Please enter the next arrival time. The sentinel is 999. 
13 


Please enter the next arrival time. The sentinel is 999. 
14 m 
Overflow 

Please enter the next arrival time. The sentinel is 999. 
18 Loc | 
departure time — [5 | 

Please enter the next arrival time. The sentinel is 999. 
19 

overflow 

Please enter the next arrival time. The sentinel is 999. 
25 

departure time = 25 

Please enter the next arrival time. The sentinel is 999. 
999 


RIF 











departure time = 35 

departure time = 45 

departure time = 55 

departure time = 65 

departure time = 75 

departure time = 85 | 

The average waiting time, in minutes, was 27.875. 
Please press the Enter key to close this output window. 


7.9.1 程序 设计 


”我 们 主要 使 用 的 类 是 CarWash。 仿 真是 事件 驱动 的 ， 也 就 是 说 在 处 理 中 ， 关 键 是 判断 下 一 
事件 是 到 达 事件 还 是 离开 事件 。 
现在 可 以 指定 三 个 方法 ， 它 们 的 接口 如 下 : 


HERR 洗车 处 为 空 。 
CarWash(); 


Mea MRF: 处 理 所 有 的 到 达 和 离开 事件 。 


void runSimulation(); 


/后 年 条 件 : 输出 平均 等 待 时 间或 一 个 错误 消息 。 

void printResult(); 

CarWash 类 的 设计 中 的 下 一 步 是 选择 字段 。 从 解决 问题 需要 的 一 些 变量 开始 ， 然后 从 这 些 
变量 中 选择 字段 。 于 人 管 硝 洗 的 车 应 当 按 办 事件 顺序 排序 ， 因此 需要 的 变量 之 一 是 队列 
carQueue。carQueue 中 的 每 一 项 是 一 个 Car 对 象 , 因此 ， 为 了 决定 Car 类 应 当 包含 的 方法 ， 暂 
时 推迟 CarWash 类 的 开发 。  、 PEE 

当 一 辆 车 离开 队列 进入 工作 站 时 ， 就 可 以 用 当前 时 间 减 去 车 的 到 达 时 间 ， 计算 出 车 的 等 
待 时 间 。 因此 Car 类 至 少 要 提供 二 个 getArrivalTime0 方 法 ， BEARN CRIS) 的 车 的 到 
IAM IRI 

现在 继续 决定 CarWash 类 中 需要 的 变量 。 正 如 前 一 段 所 指示 的 ， 应 当 有 waitingTime 和 
currentIime 变 量 。 为 了 计算 平均 等 待 时 间 , 需要 变量 numberOfCars 和 sumOfWaitingTimes。 如 
何 决定 下 一 个 事件 是 到 达 事 件 还 是 离开 事件 呢 ? 可 以 根据 变 重 nextArrivalTime (这 是 读 入 的 ) 
和 nextDepartureTime 来 决定 。 当 没有 车 被 清洗 时 ， 我 们 希望 处 理 到 达 事 件 ， 因 此 这 时 将 
nextDepartureTime 变 量 设置 成 一 个 非常 大 的 数 一 一 比方 说 10 000. 

Xit, BALSA TTA ERE, OR ye Ye BED +A PRD ek (根据 经 验 )， 类 
的 大 部 分 公有 方法 应 当 使 用 类 的 大 多 数字 段 ， 详 情 参 阅 Rie1(1996)。 无 疑 ，printResult 方 法 只 
使 用 了 变量 sumOfWaitingTimes 和 numberOfCars， 而 ranSimulation 方 法 使 用 了 全 部 变量 。 因 此 
对 字段 的 决定 可 归结 为 :哪些 变量 必须 在 移 坦 器 中 初 娩 化 ? - 

因为 carQueue 是 一 个 对 象 ， 在 它 定义 时 将 自动 初始 化 ， 所 以 它 不 需要 是 一 个 字段 。 必 须 被 
初始 化 的 非 对 象 变量 是 sumOfWaitingTimes、 numberOfCars、currentTime 和 nextDepartureTime: 
这 些 将 是 字段 。 不 需要 初始 化 waitingTime (currentTime 和 getArrival Time(0) 返 回 值 之 间 的 差 ) 


ON 
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和 nextArrivalTime 〈 它 的 值 是 读 入 的 )。 
下 面 是 目前 所 得 到 的 CarWash.h: 


#ifndef CAR_WASH 
#define CAR_WASH 


#include <string> 


#include <queue> 
#include <iostream> 


#include "car.h" 


using namespace std; 


class CarWash 


{ 
public: 


l ERR: 初始 化 这 个 CarWash.。 
CarWash( ); 


/ 后 置 条 件 : 处 理 这 个 CarWash 全 部 的 到 达 和 
/ 离开 事件 。 


void runSimulation( ); 


/ 后 置 条 件 : 输出 平均 等 待 时 间或 一 个 
if 错误 消息 。 
void printResult( ); 


protected: 


const static int INFINITY; // 指示 没有 车 正在 清洗 


const static int MAX SIZE; // carQueue m 4t ir 85 XE f 
/| 最 大 数量 


const static int WASH TIME; // 每 辆 车 清洗 的 分 钟 数 


int currentTime， 
nextDeparture Time, 
numberOfCars, 
sumOfWaitingTimes; 
y; / &CarWash 
#endif 


因为 CarWash 类 中 没有 为 对 象 的 字段 ， 所 以 也 没有 依赖 关系 图 。 
7.89.2 CarWash 类 的 实现 

我 们 已 经 完成 了 (至少 自 前 是 这 样 ) 字段 的 选择 ， 因 此 可 以 开始 方法 的 定义 了 。 构 造 器 
的 定义 是 直截了当 的 : 


CarWash::CarWash( ) 
( 








ED LLL MEE. 


currentTime = O; 

numberOfCars = 0; 

sumOfWaiting Times = 0; 

nextDepartureTime = INFINITY; 
) // 缺 省 构造 器 


在 继续 往 下 进行 之 前 ， 先 给 出 常量 定义 : 


const int CarWash::INFINITY = 10000; 
const int CarWash::MAX SIZE = 5; 
const int CarWash: WASH. TIME - 10; 


runSimulation 方 法 的 定义 说 明了 这 是 一 个 基于 事件 的 仿真 。 对 读 和 人 的 每 个 nextArrivalTime 值 ， 
如 果 这 个 时 间 小 于 nextDepartureTime 值 ， 就 处 理 一 个 到 达 时 间 并 读 和 信 另 一 个 nextArrivalTime 值 。 
否则 ， 就 处 理 一 个 离开 事件 。 当 到 达 结 束 标记 时 ， 需 要 洗 清 洗 站 中 的 以 及 仍然 在 队列 中 的 所 
有 的 车 。 

方法 定义 是 相当 简单 的 ， 因 为 推迟 了 到 达 和 离开 事件 的 处 理 : 


void CarWash::runSimulation( ) 


{ 
const string PROMPT = 


^nPlease enter the next arrival time. The sentinel is » 


const int SENTINEL = 999; 
queue <Car> carQueue; 


int nextArrivalTime; 


cout << PROMPT << SENTINEL << endl: 
cin >> nextArrivalTime; 
while (nextArrivalTime != SENTINEL) 
{ 
if (nextArrivalTime < nextDepartureTime) 
{ 
processArrival (nextArrivalTime, carQueue); 
cout << PROMPT << SENTINEL << endl: 
cin >> nextArrivalTime; 
) // if 
else 
processDeparture (carQueue); 
}/ 当 没 有 达到 SENTINEL 时 


/ 清洗 carQueue 中 余下 的 车 。 
while (nextDepartureTime < INFINITY) 
processDeparture (carQueue); 
} // runSimulation 


下 面 是 方法 processArrival 和 processDeparture (它们 是 protected 方 法 ) 的 接口 : 


I ESTE: 对 nextArrivalTime 时 刻 到 达 的 车 ， 要 么 不 准 进入 (如 果 发 送 这 个 消息 之 前 
If carQueue 已 满 ) ， 要 么 就 让 它 进 入 这 个 CarWash . 
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void processArrival (int nextArrivalTime,queue<Car>& carQueue); 


/后 置 条 件 : 一 辆 车 结束 清洗 并 且 当 carQueue 非 空 时 弹出 这 辆 车 。 
void processDeparture(queue<Car>& carQueue); 


为 了 处 理 一 个 到 达 事 件 ， 首 先 更 新 currentTime 字 段 并 检测 溢出 。 如 果 这 个 到 达 事 件 没 有 
溢出， 就 增加 numberOfCars 字 段 ， 而 且 这 辆 到 达 的 车 要 么 开始 清洗 (服务 器 为 空 时 )， 要 么 插 
入 carQueue 对 象 的 队列 。 下 面 是 代码 : 


void processArrival (int nextArrivalTime, queue <Car>& carQueue) 


{ 


const string OVERFLOW = “Overflow': 
currentTime = nextArrivalTime; 
if (carQueue.size() == MAX SIZE) 

cout << OVERFLOW << endl: 
else 
{ 

numberOfCars+ +; 

if (nextDepartureTime == INFINITY) 


nextDepartureTime = currentTime + WASH TIME; 
else 


carQueue.push (Car (nextArrivalTime)): 
} W 不 是 溢出 
) // 方法 processArrival 


这 个 方法 表露 了 是 如 何 和 Car 类 建立 关系 的 : 有 一 个 构造 器 使 用 nextArrivalTime 作 为 变 元 。 
下 面 是 Car 类 的 头 文件 和 源 文 件 : 


// Car.h 
#ifndef CAR 
#define CAR 
class Car 
public: 
I 后 置 条 件 : 这 个 Car 被 初始 化 。 
Car ( ); 


// 后 置 条 件 : 用 nextArrivalTime 初 始 化 这 个 Car 
Car (int nextArrivalTime); 


/ 后 置 条 件 : 返回 这 个 Car 的 到 达 时 间 。 
int getArrivalTime( ): 


protected: 


int arrivalTime; 
y/3«Car — 
&endif 


// Car.cpp 





#include "car.h" 
Car:Car( ) {} 
Car::Car (int nextArrivalTime) 


{ 


arrivalTime = nextArrivalTime; 


) / 构造 器 


int Car::getArrivalTime( ) 


{ 


return arrivalTime; 
) // 方法 getArrivalTime 


在 这 个 项 目 中 ， 很 容易 就 可 以 废弃 Car 类 ， 但 在 该 项 目的 后 续 扩 展 中 ， 将 需要 更 多 关于 车 
辆 的 信息 一 一 周 长 ， 是 否 可 改变 ， 车 轴 数 量 等 等 。 

为 了 处 理 一 个 离开 事件 ， 首 先 更 新 currentTime 字 段 ， 然 后 检查 在 carQueue 对 象 中 是 否 有 
车 。 如 果 有 就 取出 (出 列 ) 第 一 个 车 ,计算 它 的 等 待 时 间 并 加 到 sumOfWaitingTimes 上 ， 然 后 





开始 清洗 这 辆 车 。 否 则 ， 就 将 nextDepartureTime 字 段 设 置 成 一 个 很 大 的 数字 ， 指示 现在 没有 


车 正在 清洗 中 。 下 面 是 定义 : 


void CarWash::processDeparture (queue <Car >& carQueue) 
{ 

int waitingTime; 

cout << "departure time = "<< nextDepartureTime << endl; 

currentTime = nextDepartureTime; 

if (!carQueue.empty( )) 

{ 

'" Car car = carQueue.front( ); 
carQueue.popí ); 
waitingTime = currentTime — car.getArrivalTime( ); 
sumOfWaitingTimes += waitingTime; 
nextDepartureTime = currentTime + WASH. TIME; 
. / carQueue 3Ezs | | | 
else 007 

| nextDepartureTime = INFINITY; 
) / 方法 processDeparture | 


最 后 也 是 最 简单 的 CarWash 方 法 是 printResult 方 法 : 


void CarWash::printResult( ) 
{ 
const string NO CARS MESSAGE = "There were no cars in the car 
| wash."; 
const string AVERAGE .WAITING TIME MESSAGE = 
^AnThe average waiting time, in minutes, was "; 
if (numberOfCars == 0) 
cout << NO CARS. MESSAGE << endl: 
else 
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cout << AVERAGE WAITING TIME MESSAGE 
« « ((double)sumOfWaitingTimes / numberOfCars) 
<< endl: 
) / 方法 printResult 


271 main Re H «xt 4E US FI CarWash3E rh ifj — AM Z8 3 


#include <iostream> 
#include <string> 


#include "CarWash.h" 


using namespace std: 
int main( ) 
{ 
const string CLOSE_WINDOW_PROMPT = 
“Please press the Enter key to close this output window.": 
CarWash carWash; 
carWash.runSimulation( ); 
carWash.printResult( ); 
cout << endl << endi << CLOSE_WINDOW_PROMPT: 
cin.get( ); 
cin.get( ); 
return 0: 
) // main 


7.3.3 CarWash 方 法 的 分 析 


每 个 CarWash 方 法 将 耗费 多 少时 间 ? 使 用 缺 省 的 基础 类 deque， 在 最 坏 情 况 下 所 有 方法 花 
费 的 都 是 常数 时 间 ， 除 了 push 方 法 ， 它 在 平均 情况 下 是 常数 时 间 但 是 worstTime(n) 和 和 n 是 成 
线性 关系 的 。 即 使 在 最 坏 情 况 下 ，n 次 连续 的 插入 也 只 花费 线性 时 间 ， 因此 所 有 需要 考虑 的 只 
有 runSimulation 方 法 中 的 循环 ， 特 别 是 “ 读 - 和 =- 处理” 循环 以 及 处 理 -剩余 -车 辆 ”循环 。 
如 打 到 达 了 nz 辆 车 ,“ 读 -和 -处 理 ” 循 环 就 将 执行 ?次 ， 而“ 处理- 剩 祭 - 车 辆 ” 循环 将 执行 至 
多 6 次 : 一 辆 车 正在 清洗 中 ， 五 辆 车 在 队列 中 。 可 以 断定 ， 对 runSimulation 方 法 而 言 ， 
worstTime(n) 和 n 成 线性 关系 。 其 他 所 有 方法 的 worstTime(n) 是 常数 。 


7.3.4 随机 化 到 达 时 间 


其 实 没 必 要 读 人 到 达 时 间 。 可 以 由 仿真 程序 产生 到 达 时 间 ， 程 序 应 提供 包含 平均 到 达 有 时 
B ( 即 全 体 到 达 时 间 的 平均 值 ) 的 输入 。 为 了 根据 平均 到 达 时 间 生 成 到 达 时 间 序列 ， 需 要 了 
解 到 达 时 间 的 分 布 。 现 在 定义 一 个 函数 计算 到 达 时 间 分 布 状况 ， 即 著名 的 泊 松 分 布 。 下 面 讨 
论 的 数学 依据 超出 了 本 书 范围 ， 感 兴趣 的 读者 可 以 参阅 数学 统计 学 方面 的 文献 ， 
令 x 赴 到 达 间 隔 的 任意 时 间 。 那 么 F(x)， 也 就 是 从 现在 到 下 一 辆 车 到 达 的 间隔 至 少 为 分 钟 
[272] 的 几率 ， 它 由 下 式 给 出 : 


F (x)=exp(—x/meanArrivalTime) 








例如 ，F(0)=exp(0)=1; 也 就 是 说 ， 从 现在 至 少 过 0 分 钟 才 会 有 下 一 辆 车 到 达 的 几率。 
f£, F(meanArrivalTime)-exp(- 1) 4 0.4, F(10 000*meanArrivalTime)yr M 40. De 


如 图 7-6 所 示 。 


F(x) 





meanaArrivalTime 


图 7-6 到 达 间 隔 时 间 的 泊 松 分 布 图 


为 了 产生 随机 到 达 时 间 ， 引 入 一 个 整数 变量 ， 称 作 timeTillINext， 它 包含 了 从 当前 时 间 直 
到 下 一 辆 车 到 达 之 间 的 分 钟 数 。 按 照 如 下 方式 确定 timeTillNext 的 数值 。 根 据 分 布 函数 严 ， 经 
过 至 少 timeTillNext 分 钟 本 有 下 一 辆 车 到 达 的 几率 由 下 式 给 出 : 


exp(—timeTillNext/meanArrivalTime) 


这 个 表达 式 代 表 一 个 几率 ， 明 确 地 讲 ， 就 是 一 个 大 于 0 且 小 于 等 于 1 的 浮 点 数 。 为 了 随机 
化 这 个 几率 ， 将 表达 式 和 一 个 相同 范围 内 的 随机 数值 randomDouble 相 关联 。 调用 rand(O 国 数 返 
加 0 和 RAND_MAX 之 间 的 整数 (包括 0 和 RAND_MAX)， 其 中 RAND_MAX 是 在 实现 中 定义 的 
变量 ， 它 的 值 至 少 是 32 767。 因 此 设置 

randomDouble=rand()/double(RAND_MAX+1): 


类 型 转换 保证 了 商 是 double 类 型 。 那 么 randomDouble 变 量 包 含 一 个 大 于 等 于 0.0 并 小 于 
1.0 的 double 型 值 。 因此 1-randomDouble 将 包含 大 于 0.0 并 小 于 等 于 1.0 的 数值 。 这 正 是 我 们 需 
要 的 ， 因 此 令 1-randomDouble 等 同 于 exp(-timeTillNext/ meanArrivalTime)。 解 下 面 的 等 式 可 
以 求 出 timeTillNext 的 值 : 
time TillNext=- meanArrivalTime*iog(1—randomDouble); 


log 函 数 返 回 其 变 元 的 自然 对 数 。 最 后 ， 将 0 5 加 到 这 个 表达 式 的 右边 ， 以 便 四 舍 五 人 到 最 
接近 的 整数 : 


timeTillNextz-meanaArrivalTime*iog(1-— randomDouble)+0.5; 


为 了 说 明 数 值 是 如 何 计算 出 来 的 ， 假 设 平均 到 达 时 间 是 3 分 钟 ， 而 且 1-randomDouble 的 
BOE EDU 71582, 0.280151400 .409576J3F 25. ABA Bi 三 个 timeTillNext 的 数值 将 是 
， 即 -3*+log(0.71582)+0.5 
4 即 -3*log(0.280151)+0.5 
3, B[-3*10g(0.409576)40.5 


因此 第 一 辆 车 将 在 洗车 处 开门 后 1 分 钟 时 到 达 ， 第 二 辆 车 将 再 过 4 分 钟 之 后 即 第 5 分 钟 时 到 
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达 ， 第 三 辆 车 将 再 过 3 分 钟 即 第 8 分 钟 时 到 达 。 


实验 18: 随机 化 到 达 时 间 (所 有 实验 都 是 可 选 的 ) 





7.4 节 介绍 了 另 一 个 容器 配 接 类 一 一 stack 类 ， 它 主要 应 用 在 计算 机 系统 内 部 。 


7.4 HER 


堆栈 是 项 的 有 限 序 列 ， 并 满足 序列 中 被 删除 、 检 索 或 修改 的 项 只 能 是 最 近 插 入 序列 的 项 ， 
这 个 项 称 作 是 堆栈 “ 顶 ”的 项 。 

堆栈 中 的 项 是 反 时 间 顺 序 存储 的 : 后 入 ， 先 出 。 

例如 ， 自 助 餐厅 的 盘子 架 上 放 了 一 堆 盘 子 ， 只 能 在 顶部 进行 插 人 和 删除 。 换 一 种 方式 讲 ， 
最 近 放 上 架子 的 盘子 将 是 下 一 个 被 取 走 的 盘子 。 堆 栈 的 这 个 定义 属性 有 时 简称 为 “后 入 ， 先 
出 ”， 或 LIFO。 与 这 个 观察 一 致 ， 插 入 也 称 作 “ 推 人 ”， 删 除 也 称 作 “弹出 ”。 图 7-7a 显 示 了 二 
个 项 的 堆栈 ， 图 7-7b、c 和 d 显 示 了 两 次 弹出 然后 一 次 推 人 对 堆栈 的 影响 。 

7.4.1 节 考察 stack 类 的 方法 接口 。stack 类 的 接口 数 甚 至 比 dueue 类 还 要 少 ， 央 为 在 堆栈 中 ， 
只 有 一 个 位 置 才能 进行 插入 、 删 除 、 检 索 或 修改 操作 。 


17 
13 13 2] 


28 28 28 28 
a) bs] ok 由 推 入 21 





图 7-7 进行 若干 弹出 和 推 入 操作 后 的 堆栈 : 先 弹出 17 和 13， 然 后 推 人 21 


7.4.1 Stack 类 的 方法 接口 
stack 类 是 模板 化 的 ， 使 用 deque 作 为 缺 省 容器 类 : 


template<class T, class Container=deque<T>> 
class stack 


{ 
下 面 是 stack 类 中 全 部 方法 的 接口 。 注 意 它们 和 queue 类 的 相似 性 。 


. /后 置 条 件 : 这 个 堆栈 为 空 ， 也 就 是 ， 它 不 包含 任何 项 ， 
explicit stack (const Container&-Container()); 


AGREE: HRAMERASREAK, SR ROR. 
bool empty(); 


. /后 置 条 件 : 返回 这 个 堆栈 中 项 的 数量 。 


unsigned size(); 


— 


M 


QJ 


4. /后 置 条 件 : x 被 插入 到 堆栈 的 项 部。 average Time(n) 2 # XX, worstTime(n) 
// 是 O(n)，、 但 是 对 n 次 连续 的 推 入 操作 ， 全 部 n 次 推 入 的 worstTime(n) 也 失 是 
// O(n), hei, amortizedTime(n) i SEX. 


void push (const T& x); 
ORR: 这 个 堆栈 非 空 。 


C 
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/后 置 条 件 : 返回 对 这 个 栈 顶 项 的 引用 。 
T& top(); 


. // 前 置 条 件 : 这 个 堆栈 非 空 。 
/后 置 条 件 : 返回 对 这 个 栈 顶 项 的 一 个 常量 引用 。 
const T& top() const; 


. // 前 置 条 件 : 这 个 堆栈 非 空 。 

// 后 置 条 件 : 移 走 本 方法 调用 前 位 于 栈 顶 的 项 。 

void pop(); 
注意 这 个 方法 并 不 返回 弹出 的 项 。 如 果 想 访问 弹出 的 项 ， 应 在 调用 pop() 之 前 先 调 
用 top(O 万 法 。 


ie») 


~ 


7.4.2 使 用 stack 类 


迭代 器 不 能 在 堆栈 中 使 用 ， 因 为 只 有 堆栈 顶部 的 项 才 是 可 以 访问 的 。 这 并 不 代表 不 能 够 
输出 堆栈 。 但 是 输出 操作 不 能 使 用 任何 除 方法 接口 之 外 的 堆栈 细节 信息 。 在 7.1.2 节 中 试图 输 
出 queue 容 器 内 容 时 也 有 相似 的 情况 。 这 里 有 一 个 小 程序 可 以 产生 图 7-7 所 示 的 堆栈 : 


#include <iostream> 
#include <vector> 
#include <string> 
#include <stack> 


using namespace std: 


void printStack (stack< int, vector<int> > ages) 

{ ~ 
cout << endl << endl << "Here is the current stack:" << endl: - 
while (!ages.empty( )) 

{ 
cout << ages.top( ) << endl; 
ages.pop( ); 
= J while 
) // gy Sx printStack 


int main( ) 
{ . | 
const string CLOSE WINDOW. PROMPT - = 

“Please press the Enter key to close this output y window.” "m 
stack<int, vector< int> > ages; 
ages.push (28); 
ages.push (t3); 
ages.push (17); 
printStack (ages); 


ages.pop ( ); 
printStack (ages); 


ages.pop( ); 
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printStack (ages); 
ages.push (21): 
printStack (ages); 
cout << endl << endl << CLOSE. WINDOW PROMPT; 
cin.get( ); 
return 0; 
) // main 


7.4.8 stack 类 是 一 个 容器 配 接 器 


与 queue 类 一 样 ，stack 类 也 是 一 个 容器 配 接 器 : 也 就 是 说 ，stack 类 的 方法 是 根据 一 些 基础 
容器 类 的 方法 定义 的 。 配 接 的 容 絮 类 必须 包含 下 列 方法 : empty, size, push back, pop back 
和 back。 注 意 这 暗示 着 : 堆栈 的 顶部 是 容器 类 的 尾部 | 

对 癌 量 、 链 表 和 双 端 队列 而 言 ， 在 平均 情况 下 ，push_back 和 pop_back 只 花费 常数 时 间 ， 
而 且 amortizedTime(n) 也 是 常数 。 因 此 不 管 是 Vector 类 、degue 类 或 是 list 类 ， 都 能 配 接 stack 类 ， 
其 中 缺 省 的 是 双 端 队列 类 。 

对 标准 模板 库 中 所 有 的 容器 配 接 器 而 言 ， 它 的 设计 只 有 一 个 字段 : 


Container c; 


而 且 正 如 queue 类 的 实现 一 样 ， 所 有 的 stack 方 法 定义 都 是 单行 的 ， 其 中 c 调 用 了 相应 的 方 
法 。 例 如 ， 下 面 是 stack 类 的 两 个 方法 定义 : 

void pop( ) 

{ 


c.pop_back( ); 
)/ 方法 pop 


T& top 
{ 


return c.back( ); 
)// 方法 top 


7.1.4 市 中 曾 考 虑 为 queue 类 配 接 一 个 用 户 开 发 的 容器 。queueArray 类 满足 所 要 配 接 的 容器 
的 需求 ， 它 有 一 个 很 吸引 人 的 特点 : 它 是 一 个 环形 的 数组 ， 只 要 队列 中 项 的 数量 不 大 于 数组 
的 大 小 ， 就 不 需要 调整 它 的 大 小 。 可 以 开发 一 个 stackArray 类 ， 使 它 满 足 配 接 stack 类 的 容器 的 
需求 。 但 是 这 个 类 没有 可 取 之 处 : 它 只 是 简陋 地 模仿 vector 类 。 因 为 任何 C++ 编译 器 都 需要 提 
供 一 个 vector 类 ， 所 以 这 可 以 绕 过 stackArray 类 的 开发 。 

现在 集中 精力 看 几 个 重要 的 应 用 。 


7.5 ”堆栈 应 用 1: 递归 是 如 何 实现 的 


在 第 4 章 中 已 经 看 到 递归 方法 的 几 个 范例 。 依 照 抽象 原理 ， 我 们 只 关注 递归 做 什么 而 忽略 
了 递归 是 如 何 通过 编译 器 或 解释 器 实现 的 问题 。 这 说 明 可 视 化 帮助 一 一 运行 结构 框架 -一 和 这 
个 实现 是 紧密 相关 的 。 现 在 略 述 一 下 堆栈 是 如 何 应 用 在 递归 实现 中 的 ， 以 及 在 这 个 应 用 中 国 
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Be (特别 是 递归 函数 ) 的 时 间 空 间 含 义 。 

每 当 发 生 一 个 函数 调用 ， 不 论 它 是 否 是 递归 的 都 要 保存 调用 函数 的 返回 地 址 。 保存 这 个 
信息 是 因为 这 样 计 算 机 将 清楚 函数 执行 结束 后 ， 应 当 在 哪里 恢复 调用 国 数 的 运行 。 同 理 ， 还 
必须 保存 大 量 有 关 函 数 局 部 变量 的 信息 。 这 是 为 了 防止 当 函 数 直 接 或 间接 递归 时 信息 被 破坏 。 
在 4.9 节 中 提 到 过 ， 编 译 器 不 止 为 递归 ， 而 是 为 所 有 的 图 数 保存 这 个 信息 。 这 个 信息 统称 为 活 
动 记录 或 堆栈 帧 。 

每 个 活动 记录 包括 : 

1) 一 个 包含 调用 函数 返回 地 址 的 变量 。 

2) 对 每 个 引用 形 参 ， 有 一 个 包含 相应 变 元 地 址 的 变量 。 

3) 对 每 个 值 形 参 ， 有 一 个 变量 ， 它 开始 时 包含 相应 变 元 值 的 拷贝 。 

4) 在 函数 块 中 声明 的 每 个 变量 。 

可 以 用 一 个 运行 时 堆栈 实现 递归 ，。 

主 存 的 一 部 分 一 一 堆栈 一 一 被 分 配 为 运行 时 堆栈 ， 当 函数 被 调用 时 将 一 个 活动 记录 推 人 其 
中 ,并 且 当 函数 执行 结束 时 再 弹出 一 个 活动 记录 。 在 函数 执行 过 程 中 ， 顶 部 的 活动 记录 包含 
了 消 数 的 当前 状态 。 

举 一 个 简单 的 例子 ,跟踪 一 个 包括 第 4 章 的 writeBinary 函 数 的 小 程序 的 运行 。 返 回 地 址 被 
注释 成 RA1 和 RA2。 

#include <iostream> 

#include <string> 


int main( ) 


{ 





const string PROMPT = “Please enter a nonnegative integer’: 


const string CLOSE_WINDOW_PROMPT = 
"Please press the Enter key to close this output window.": 
int n; | 
cout << PROMPT, 
cin >> n; 
if (n < 0) 
cout << "Error: You entered a negative integer."; 
else 
writeBinary (n); // RA1 


cout << endl << endl << CLOSE WINDOW PROMPT: 
cin.get( ); 
return 0; 


) // 函数 main 


/ 前 置 条 件 : n 是 十 进 制 表示 法 中 的 一 个 非 负 整数 。 
/ RER: 输出 n 的 二 进 制 表示 。worstTime(n) 
/i 是 O(log n), 
void writeBinary (int n) 
{ 
if (n == 0]|[n == 1) 
cout << n; 


M 
~] 
-J 





218 | PTE 


else 


writeBinary (n / 2); // RA2 
cout (n % 2); 
) // else 
) // writeBinary 


writeBinary 函 数 用 值 形 参 n 作 为 它 惟一 的 局 部 变量 ， 因 此 每 个 活动 记录 将 包含 两 个 字段: 
1) 一 个 字段 表示 返回 地 址 。 | 
2) 一 个 字段 表示 值 形 参 n 的 值 。 | | 
LA EHO. 4 JA main eg cre Fl writeBinaryBE, JEFE — BAIR CHE AGE 
栈 ， 如 图 7-8 所 示 。 因 为 no>1， 所 以 用 3 ( 即 6/2 ) 作为 实 套 值 递 归 调 用 writeBinary。 于 是 创建 第 
二 个 活动 记录 并 将 其 推 人 堆栈 ， 如 图 7-9 所 示 。 
RAI 
n| 6 | 
活动 堆栈 


图 7-8 第 一 次 激活 writeBinary 方 法 之 前 的 活动 堆栈 。RA1 是 返回 地 址 


活动 堆栈 
(两 个 记录 ) 
图 7-9 第 二 次 激活 writeBinary 方 法 之 前 的 活动 堆栈 


因为 n 的 值 仍然 大 于 1， 所 以 再 次 调用 writeBinary， 这 次 使 用 1 ( 即 3/2) 作为 实 参 值 。 然 后 
创建 第 三 个 活动 记录 并 将 其 推 人 ， 如 图 7-10 所 示 。 


(三 个 记录 ) 
图 7-10 第 三 次 激活 writeBinary 方 法 之 前 的 活动 堆栈 
因为 n=1， 所 以 输出 n 的 值 。 输 出 是 
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这 完成 了 writeBinary 方 法 的 第 三 次 激活 ， 因 此 堆栈 弹出 并 返回 到 地 址 RA2， 堆 栈 如 图 7-11 
所 示 。 执 行 writeBinary 方 法 中 RA2 地 址 处 的 输出 语句 ， 而 且 输 出 是 3%2， 即 ， 

1 


RA2 
n] 3 | 
RAI 
| 6 | 
活动 堆栈 
(两 个 记录 ) 
图 7-11 完成 writeBinary 方 法 的 第 三 次 激活 之 后 的 活动 堆栈 
堆栈 再 次 被 弹出 并 再 一 次 返回 到 RA2， 如 图 7-12 所 示 。RA2 地 址 处 的 输出 语句 的 输出 是 
6%2 的 值 ， 即 ， 
0 
这 就 完成 了 writeBinary 方 法 的 最 初 的 激活 。 堆 栈 再 一 次 被 弹出 ， 变 成 空 ， 并 返回 到 RA1 一 一 


在 main 国 数 的 尾部 。 完 整 的 输出 是 : 
110 


它 是 输入 值 6 的 二 进 制 等 值 形式 。 


EE] 
n| 6 | 
活动 堆栈 
图 7-12 完成 writeBinary 方 法 的 第 一 次 激活 之 后 的 活动 堆栈 
对 一 个 引用 形 参 而 言 ， 相应 变 元 的 地 址 被 推 人 堆栈 。 当 生成 机 器 代码 时 ， 编 译 器 将 引用 
形 参 的 每 次 出 现 都 看 作 是 指向 相应 变 元 的 指针 。 例如 ， 考 虑 下 面 的 main 国 数 : 
int main( ) | | | | | | 
| 
string s = "maybe 
int i = 3; 
sample (s, i); // RA1 
cout<<s << ""<<i; | 


. return 0; 
) // gh main 


sample 函 数 的 定义 是 : 


void sample (string& x, int y) 
{ 
x.insert (0, “$"); 
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\ 
if (y > 0) 
sample (x, y); // RA2 
) // sample 


"E E KP) FRB 55 T ii eR BCA AE CI FCRI: — BY: 
x-»insert (0, "$"); 
yov; 
if (y > 0) 
sample (*x, y); 


在 开始 sample 的 第 二 次 递归 调用 时 ， 堆 栈 到 达 了 最 大 高 度 3: 





— [SSmaybe | s 


这 样 ， 另 一 个 “$” 被 增加 到 x， 并 减少 y。 因 为 y 不 再 大 于 0， 因 此 不 再 进行 递归 调用 。 三 
次 弹出 之 后 ， 输 出 是 

$$$maybe 3 

变 元 s 受 sample 函 数 调用 的 影响 ， 因 为 相应 形 参 x 是 一 个 引用 参数 。 另 一 方面 ， 变 元 i 不 受 
sample 函 数 调用 的 影响 ， 因 为 对 应 i 的 形 参 ， 即 y， 它 是 一 个 值 参 。 

这 个 讨论 应 当 已 说 明了 编译 器 是 如 何 实现 递归 的 大 体 观 点 。 有 一 个 活动 记录 堆栈 处 理 所 
有 的 函数 调用 ， 因 此 每 个 记录 必须 包含 一 个 保存 记录 大 小 的 字段 。 那 样 就 可 以 弹出 正确 数量 
的 字 节 。 为 了 简化 ， 忽 略 讨 论 中 的 细节 。 另 一 个 技术 性 问题 涉及 到 如 何 操作 一 个 〈 非 void ) 
函数 返回 的 数值 ， 细 节 问 题 随 编译 器 不 同 而 不 同 。 一 个 公用 技术 是 在 执行 返回 前 将 数值 推 入 
栈 顶 。 然 后 调用 函数 的 工作 就 是 采取 适当 的 行为 ， 它 至 少将 包含 堆栈 的 弹出 操作 。 

编译 器 必须 为 运行 时 的 活动 堆栈 的 创建 和 维护 产生 代码 。 每 次 进行 一 个 调用 -一 -甚至 是 一 
个 非 递 归 调 用 ， 必 须 保 存 完整 的 局 部 环境 。 这 可 能 效率 很 低 ， 不 管 是 在 时 间 方 面 还 是 在 空间 
方面 ， 例 如 ， 把 一 个 庞大 的 容器 对 象 传递 给 值 形 参 时 。 在 这 种 情况 下 ， 无 论 何 时 进行 调用 都 
将 把 整个 容器 的 拷贝 推 入 堆栈。 

如 果 读 者 已 经 设计 了 递归 函数 ， 应 当 评 估 一 下 程序 中 递归 的 时 间 -空间 开销 的 潜在 影响 。 
如 果 发 现 开销 过 大 ， 就 需要 将 递归 函数 转换 成 迄 代 函 数 。 这 总 是 可 以 实现 的 。 

如 果 提 出 迭代 隔 数 很 困难 ， 可 以 用 夫 代 函数 模拟 递归 函数 ， 它 创建 并 维护 自身 的 堆 米 ， 
其 中 保存 了 需要 的 信息 。 例 如 ， 编 程 项 目 7.3 需 要 第 4 章 的 回溯 应 用 中 的 (递归) tryToSolve 方 








EMER. SOR CHERITON p. Dun. ROR ARE A 3 
SANEA., MARERE BEBE. Pi AbwriteBinary AAR, BPE 
本 (writeBinary ARHI Ae TERRIER ORAS Be 218814 2.) . 


1/ 前 置 条 件 : n 是 十 进 制 表示 法 中 的 一 个 非 负 整数 。 
/ 后 置 条 件 : 输出 n 的 二 进 制 表示 。worstTime(m) 
/ 是 O(logn)。 
void writeBinary (int n) 
{ 

stack<int> myStack; 

myStack.push (n); 

while (n > 1) 


{ 
n = n/2; 
myStack.push (n); 


} /7 推 入 
while (!myStack.empty( )) 


{ 


n = myStack.top( ); 
myStack.pop( ); 
cout << (n % 2); 


) // 弹出 


cout << endl << endl: 


) // 方法 writeBinary 


不 要 忽略 了 将 递归 国 数 转换 成 迭代 函数 所 付出 的 时 间 代 价 。 一 些 递归 函数 ， 像 factorial 和 
Fibonacci 因 数 ， 很 容易 就 可 以 转换 成 迭代 函数 。 而 有 些 函 数 的 转换 就 没 那么 简单 了 ， 像 第 4 章 
的 move、tryToSolve 和 permute 函 数 。 而 且 ， 和 迭 代 版 本 可 能 缺乏 递归 版 本 的 简洁 优美 ， 这 使 得 
它 的 验证 和 维护 很 复杂 。 

如 同 第 4 章 中 提 到 的 ， 如 果 已 经 准备 好 一 个 迭代 函数 ， 并 且 它 的 效率 还 可 以 接受 的 话 ， 那 
么 网 使 用 它 。 如 果 不 行 ， 那 么 在 环境 允许 的 情况 下 应 当 考 虑 递归 函数 。 也 就 是 说 ， 只 要 问题 
在 如 下 的 情况 就 可 以 尝试 递归 : 问题 的 复杂 实例 可 以 简化 成 与 原 问题 形式 相同 的 简单 实例 
并 且 最 简单 的 实例 可 以 直接 解决 。 有 关 活 动 堆栈 的 这 个 讨论 有 助 于 做 出 全 面 、 平衡 的 决定 。 

7.6 节 描述 了 另 一 个 和 编译 器 相关 的 应 用 : 将 表达 式 转换 成 机 器 代码 。 转 换 的 一 个 重要 方 

WH EARS CAL. ARES, 这 里 给 出 一 小 段 程序 测试 括号 是 否 匹 配 。 输入 一 串 左 括号 
和 布 括 号 ， 然 后 输出 指示 括号 是 否 匹 配 。 例 如 ， 下 面 的 字符 串 由 匹配 的 括号 组 成 : 

(() ()) 

O ((())) 

而 下 面 的 两 个 字符 串 包 含 了 不 匹配 的 括号 : 


MOM 
CO) 


AS ME: 当 遇 到 一 个 “(” 时， 将 它 推 人 堆栈 ; 当 遇 到 “)， 有 时 ， 就 弹出 堆栈 ， 除 非 


它 已 空 。 当 到 达 输 入 字符 串 尾部 了 时， 如 果 堆 栈 为 空 就 说 明 括号 是 匹配 的 。 


h3 
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3 
N 
* 


#include <vector> 
#include <stack> 
#include <iostream> 
#include <string> 


using namespace std; 


int main( ) 


{ 


const string PROMPT = "Please enter a string of parentheses: "; 
const char LEFT = '(*; 

const char RIGHT = ')'; 

const string SUCCESS = "The parentheses are matching."; 
const string FAILURE = "The parentheses are NOT matching."; 


const string CLOSE WINDOW PROMPT - 
"Please press the Enter key to close this output window."; 


stack« char, vector<char> > parenStack; 
string parens; 
bool matching = true; 


cout << PROMPT; 
cin >> parens; 
for (unsigned i = 0; i « parens.length( ) && matching; i+ +) 
if (parens [i] == LEFT) 
parenStack.push (LEFT); 
eise if (parens [i] == RIGHT) 
if (parenStack.empty( )) 
matching = false; 
else 
parenStack.pop( ); 


if (matching && parenStack.empty( )) 

cout << endl << SUCCESS << endl; 
else 

cout << endl << FAILURE << endl; . 
cout << endl << endl << CLOSE WINDOW PROMPT; 
cin.get( ); | ts 
return 0; 

. ) // main 


注意 ， 如 采 堆 栈 已 空 而 又 遇 到 一 个 布 括号 时 就 退出 循环 。 忽 略 除 左 、 右 括号 之 外 的 所 有 
字符 。 这 个 程序 可 以 在 本 书 网 站 的 源 代 码 链接 中 找到 。 


7.6 堆栈 应 用 2: PPAR aR 
7.5 节 中 说 明了 一 个 编译 器 或 解释 器 是 如 何 实现 递 轨 的 。 本 节 将 介绍 另 一 个 “内 部 ”应 用 : 








算术 表达 式 从 中 绥 到 后 绥 表 示 法 的 转化 。 这 是 编译 器 在 创建 机 器 层次 的 代码 时 或 者 解释 器 求 
算术 表达 式 值 时 的 关键 任务 。 

中 缀 表示 法 中 ， 二 元 运算 符 放 在 它 的 操作 数 之 间 。 例 如 ， 图 7-13 显 示 了 中 缀 表示 法 中 的 
几 个 算术 表达 式 。 为 了 简化 起 见 ， 一 开始 先 将 注意 力 放 在 单字 母 标识 符 、 贺 括号 以 及 二 元 运 
"fL. -. WV E. 


a+b 
b-c*d 
(b —c)*d 


a-c-h/b*c 
a— (c—- h)/(b*c) 





图 7-13 采用 中 组 表示 法 的 几 个 算术 表达 式 
算术 的 常用 规则 是 : 
1) 运算 通常 都 是 从 左 向 右 执 行 的 。 例 如 ， 如 果 有 
a+b-c 
那么 将 先 执行 加 法 。 


2) 如 采 当 前 运算 符 是 + 或 -， 并 且 下 一 个 运算 符 是 * 或 /， 那 么 将 在 当前 运算 符 之 前 先 应 用 
下 一 个 运算 符 。 例 如 ， 如 果 有 


b + c*d 
那么 在 加 法 之 前 先 运行 乘法 。 对 
a-b+c*d 


应 先 执行 减法 ， 然 后 是 乘法 ， 最 后 是 加 法 。 可 以 将 这 个 规则 解释 为 乘法 和 除法 比 加 法 和 
减法 有 “更 高 的 优先 级 ”。 

3) 可 以 用 括号 改变 规则 1 和 规则 2 所 指定 的 顺序 。 例 如 ， 如 果 有 

3 一 (b+c) 

那么 先 执行 加 法 。 同 理 ， 对 

(a ~ b)*c - 

就 先 执 行 减法 。 

图 7- M EE: 图 7- -3 中 最 后 两 个 表达 式 的 求 值 顺序 。 


a-c-h/b*c | a- (c - h)/(b*c) 


IN 





图 7-14 图 7-13 中 最 后 两 个 表达 式 的 求 值 顺序 


ho 
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第 一 个 广泛 使 用 的 编程 语言 是 FORITRAN (FORmula TRANslator), ， 如 此 命名 是 因为 所 的 
编译 器 可 以 将 算术 公式 转化 成 机 器 层 的 代码 。 在 早期 (1960 年 之 前 ) 的 编译 器 中 ， 这 个 转化 
是 直接 进行 的 。 但 是 直接 转化 是 很 难 使 用 的 ， 因 为 在 了 解 一 个 运算 符 的 两 个 操作 数 之 前 ， 不 
能 生成 它 的 机 器 层 的 代码 。 这 个 要 求 使 得 当 每 个 操作 数 都 是 一 个 括号 括 起 来 的 子 表 达 式 时 ， 
非常 难于 处 理 。 

7.6.1 后 组 表示 法 

在 后 级 表示 法 中 ， 运 算 符 紧 随 在 它 的 操作 数 的 后 面 。 

现代 编译 器 不 会 直接 将 算术 表达 式 转 化 成 机 器 层 的 代码 。 而 是 使 用 一 个 中 间 形 式 ， 称 为 后 
缀 表示 法 。 在 后 绥 表 示 法 中 ， 运 算 符 紧 随 在 它 的 操作 数 的 后 面 。 例 如 ， 给 出 中 组 表达 式 a + b, 
它 的 后 缀 形式 就 是 ab+。 对 a + b*c， 后 级 形式 是 abc*+， 因 为 + 的 操作 数 是 a 以 及 b 和 c 的 乘 

(a+b)*c 

其 后 级 形式 是 

ab+c* 

因为 在 后 缀 表示 法 中 运算 符 就 紧 随 着 它 的 操作 数 ， 不 需要 括号 ， 因 而 没有 使 用 括号 。 图 
7-15 显 示 了 几 个 算术 表达 式 的 中 组 和 后 缀 表示 法 。 


a-bt+c*d ab 一 cd “十 


ac-c-h/b*'r ac + hb/r* — 


a--(c-h)/(b*r ach — br*/+ 





图 7-15 RA a AE PEAY LAR eA 
怎么 样 才能 将 中 组 表示 法 的 算术 表达 式 转化 成 后 缀 表示 法 呢 ? JE BED Re RPE FE 一 个 
字符 串 ， 然 后 再 试 着 提出 相应 的 后 级 字符 串 。 后 级 字符 串 中 的 标识 符 将 和 中 组 字符 串 中 的 - 
致 ， 因 此 ， 一 旦 遇 到 一 个 标识 符 ， 就 可 以 将 它 添加 进 后 绥 字 符 串 。 但 是 在 后 缀 表示 法 中 ， 运 


算 符 必须 放 在 它们 的 操作 数 之 后 。 因 此 ， 在 中 绥 字 符 串 中 遇 到 一 个 运算 符 时 ， 必 须 先 临时 地 


保存 它 。 

例如 ， 假 设 要 将 中 组 字符 串 

a -b+cd | 

转化 成 后 组 字符 申 。( 空格 只 是 为 了 便于 阅读 ， 现 在 还 不 需要 将 它们 考虑 成 中 组 表达 式 的 
一 部 分 。) RAP AR: 

a 被 添加 进 后 绎 ， 后 缀 现在 是 “a” 

一 ”被 暂时 保存 
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bb” 被 添加 进 后 缀 ， 后 组 现在 是 “ab- 

当 遇 到 “+ BT. 注意 因为 它 的 优先 级 和 “- ”相同 ,所 以 根据 自 左 向 右 规 则 (算术 规则 1 ), 
应 当先 执行 减法 。 因 此 将 “- ”加 入 后 组 字符 串 并 暂时 保存 “+ ` ， 后 组 字符 串 现 在 是 “ab- ”。 
然后 将 “c” 加 入 后 缀 ， 后 绿 变 成 “ab-c”。 

乘法 比 加 法 的 优先 级 别 高 ， 因 此 “*” 应 当 在 “+ ”之 前 加 入 后 级 。 但 是 也 必须 先 暂 时 保 
存 “”， 因 为 它 的 一 个 操作 数 ( 即 “d ) 还 设 有 加 入 后 缀 。 

当 “d” 加 入 后 缀 时 ， 后 缀 字符 串 变 成 “ab-~cd"。 和 那么 加 入 “*:， 后 组 字符 串 变 成 “ab- 
cd* 。 节 后 加 入 “+  ， 最 终 的 后 缀 表示 形式 是 “ab--cd*+”。 

临时 存储 工具 用 堆栈 是 很 方便 的 。 管 理 这 个 operatorStack 对 象 的 规则 是 : 

1) 初始 状态 下 ，operatorStack 为 空 。 

2) 对 中 组 字符 串 中 的 每 个 运算 符 ， 执 行 循环 ， 直 到 运算 符 被 推 人 operatorStack 对 象 : 如 
有 洒 operatorStack 对 象 为 空 或 者 中 组 运算 符 的 优先 级 比 operatorStack 对 象 顶 部 的 运算 符 高 ， 那 各 
将 运算 符 推 人 operatorStack 对 象 ; 否则 ， 弹 出 operatorStack 对 象 ， 并 将 弹出 的 运算 符 加 入 后 绥 
X RE. 

3) 一 旦 到 达 输 入 字符 串 的 尾部 ， 则 执行 循环 ， 直 到 operatorStack 对 象 为 空 ， 弹出 operator- 
Stack XY Zt Ff FSH tH ize BEF US HE GR EF B 

这 些 规则 的 基本 事实 可 以 总 结 如 下 : 

中 缀 优先 级 高 ， 推 入 

例如 ， 图 7-16 显 示 了 将 表达 式 


a+c— h/b*r 


中 组 表达 式 : ate-h/b*r 
"ÉL operatorStack MR — 


acthb/r 


ac+hb/r* 





ac+hb/r* 


图 7-16 将 a +c- lyb'rb RGR. (Ed, 
operatorstack 对 象 的 栈 顶 就 是 它 最 右边 的 项 


to 
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转化 成 它 的 后 组 形式 的 过 程 中 ， 运 算 符 堆栈 的 历史 记录 。 怎 样 处 理 括号 呢 ? APRs 
串 中 遇 到 一 个 左 括号 时 ， 立 即将 它 推 人 operatorStack 对 象 ， 但 是 把 它 的 优先 级 定义 得 比 任何 一 
元 运算 符 都 低 。 在 中 缀 字符 串 中 遇 到 右 插 号 时 ，operatorStack 对 象 就 不 断 地 弹出 ， 并 将 弹出 的 
项 加 入 后 组 字符 串 ， 直 到 栈 顶 的 “运算 符 ” 是 一 个 左 括号 。 然 后 弹出 左 括号 ， 但 不 将 它 加 入 
RR, FARA PRET. 

例如 ， 将 a*(b + c) 转 化 成 后 缀 时 ， 项 *、( 和 + 将 被 推 信 ， 然 后 当 遇 到 右 括 号 时 将 弹出 “+， 
和 “(”( 后 人 ， 先 出 )。 最 后 的 后 级 形 式 是 





abc+* 
288 图 7-17 上 展示 了 一 个 更 复杂 的 例子 ， 将 x - (y*a/b — (z+ d*e) + cj/f 转 化 成 后 组 形式 。 
FRKE: x-(y*a/b-(z+d*e)+c)/f 
"pas operatorStack RZ 
X 
( 
y 
a 
/ 
b 
( 
Z 
十 
d 
e 
xya*b/zde* * —c 
xya*b/zde* - —c-- 
xya*b/zde*-- -c+ 
xya*b/zde*+—c+ 
xya'b/zde* -- — c--f 
xya*b/zde*+—c+f/ 
xya*b/zde* + —c+f/— 
后 绿 表 达 式 : xya*b/zde*+—c4f/-— 
图 7-17 将 x — (y'alb ~ (z + d*e) + O/H UE HEUS SUE. 
每 一 步 中 operatorStack 对 象 的 栈 顶 就 是 它 最 右边 的 项 
7.6.2 转换 矩阵 


在 转化 处 理 的 每 一 步 ， 只 要 知道 中 绥 字 符 串 的 当前 字符 和 运算 符 堆栈 的 栈 顶 字 符 ， 就 能 
确定 采取 什么 样 的 行为 。 所 以 可 以 创建 一 个 矩阵 来 概述 转化 过 程 。 行 下 标 代表 当 前 中 缓 字符 
的 可 能 值 ; 列 下 标 代表 运算 符 堆 栈 的 栈 顶 字符 的 当前 值 ， 和 矩阵 的 条 目 代 表 即 将 采取 的 行为 。 





EN Ee i Rc M uS LL ee CE” AS 


这 样 的 矩阵 称 作 转换 矩阵 ， 因 为 它 指 出 了 从 一 个 形式 转换 到 另 一 个 形式 的 转换 信息 。 图 7-18 
显示 了 将 一 个 简单 表达 式 从 中 绥 表 示 法 转化 成 后 缀 表示 法 的 转换 矩阵 。 

图 7-18 中 的 转换 矩阵 的 图 形 化 表现 使 我 们 马上 就 能 看 出 如 何 将 一 个 简单 的 表达 式 从 中 级 

转化 成 后 缀 。 现 在 可 以 设计 和 实现 程序 来 完成 这 个 转化 。 出 于 可 扩展 性 上 的 考虑 ， 程 序 可 以 
与 图 7-18 中 的 转换 矩阵 合 起 来 考虑 : 扩展 矩阵 以 适应 更 复杂 的 表达 式 。 


运算 符 堆栈 顶 字符 





图 7-18 将 简单 表达 式 从 中 缀 表示 法 转化 成 后 缀 表示 法 的 转换 矩阵 


7.6.3 记号 


使 用 转换 矩阵 的 程序 可 能 不 能 操作 字符 本 身 ， 因 为 每 个 字符 都 有 太 多 可 能 的 (合法 ) 值 。 
例如 ， 为 每 个 合法 的 中 组 字符 使 用 一 行 的 转换 矩阵 中 ， 只 一 个 标识 符 就 需要 52 行 。 并 且 如 果 
改变 规则 ， 即 允许 使 用 多 个 字符 的 标识 符 ， 那 么 将 需要 数 百 万 行 ! 

当 一 个 程序 被 记号 化 时 ， 它 被 分 成 小 的 有 意义 的 单元 。 

取而代之 的 是 ， 合 法 的 字符 通常 被 组 合成 “记号 ”。 记 号 是 程序 中 最 小 的 有 意义 的 单元 。 
每 个 记号 都 有 两 部 分 : 通用 部 分 和 具体 部 分 。 通 用 部 分 保存 它 的 类 别 ， 具 体 部 分 使 我 们 能 取 
回 记 号 化 的 字符 。 为 了 将 简单 的 中 组 表达 式 转化 成 后 级， 将 记号 分 类 为 : identifier. rightPar, 
leftPar、addOp (表示 + 和 一 )、multOp (表示 * 和 /) 以 及 empty (表示 虚 值 )。 具体 部 分 将 包含 
中 组 字符 串 中 记号 化 字符 的 索引 。 例 如 ， 给 出 中 绥 字 符 串 


a +b*c 


要 记号 化 “b ， 将 设置 它 的 类 别 为 identifier， 索 引 是 2。 

记号 的 结构 随 编译 器 的 不 同 有 很 大 的 分 别 。 一 般 说 来 ， 变 量 标识 符 的 记号 的 具体 部 分 包 
含 了 在 表 中 的 地 址 ， 这 个 表 称 作 是 符号 表 。 该 地 址 上 将 存储 标识 符 、 变 量 标识 符 指示 、 它 的 
类 型 、 初 始 值 、 声 明 它 的 块 以 及 对 编译 器 有 用 的 其 他 信息 。 
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实验 19 中 开发 了 一 个 完整 的 “中 缀 到 后 级 ”项 目 ， 使 用 了 记号 和 大 量 的 输入 编辑 。 


实验 19: 将 中 绎 转化 成 后 组 (所 有 实验 都 是 可 选 的 ) 


7.6.4 前缀 表 示 法 


在 前 缀 表示 法 中 ， 运 算 符 直接 放 在 操作 数 的 前 面 。 
7.6.1 证 中 描述 了 如 何 将 一 个 中 级 表达 式 转 化 成 后 缀 表示 。 另 一 种 可 能 是 将 中 级 转 化 成 前 
缀 表示 ， 前 级 表示 法 9 中 运算 符 直 接 放 在 它 的 操作 数 的 前 面 。 图 7-19 显 示 了 几 个 算术 表达 式 的 


ra UR EURO. 


a-b -ab 
a-b*c —a*bc 

(a - b)*c “一 abc 
a-~b+t+c*d 十 一 ab*cd 
a+c—h/b*d -+ac*/hbd 
h/(b*d -a/-ch*bd 








图 7-19 JL BOR AAA} BOR Ra 
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转换 中 一 样 ， 需 要 保存 每 个 运算 符 ， 直 到 获得 它 的 全 部 两 个 操作 数 。 但 是 不 能 只 是 遇 到 -- 个 
你 识 符 ， 就 将 它 加 入 前 缀 字符 串 。 取 而 代 之 的 是 ， 这 里 将 需要 保存 每 个 标识 符 ， 实 际 上 是 每 
个 操作 数 ， 直 到 获得 它 的 运算 符 。 

操作 数 和 运算 符 的 保存 利用 两 个 堆栈 对 象 一 一 operandStack 和 operatorStack 一 一 是 很 容易 
实现 的 。 最 初 两 个 堆栈 都 为 空 。 在 中 组 字符 串 中 遇 到 一 个 标识 符 时 ， 就 将 它 推 人 operandStack 
对 象 。 管 理 operatorStack 对 象 的 规则 就 像 中 缀 到 后 缀 的 转化 中 一 样 。 

operandStack 对 象 怎么 样 呢 ? 假设 刚刚 从 operatorStack 对 象 中 弹出 了 栈 顶 运算 符 一 -opt， 
然后 也 从 operandStack 对 象 的 栈 顶 弹出 了 两 个 操作 数 一 -opnd1 和 opnd2。 连 接 (结合 在 一 起 ) 
opt、opnd2 和 opnd1， 并 将 结果 推 人 operandStack 对 象 。 重 要 的 是 : 在 连接 中 ， opnd2 应 在 
opnd1 之 前 ， 因 为 opnd2 是 在 opnd1 之 前 推 和 人 operandStack 对 象 的 。 

持续 这 个 过 程 直到 到 达 中 组 表达 式 的 尾部 。 然 后 重复 下 面 的 过 程 直到 operatorStack 为 空 : 

从 operatorStack 对 象 中 弹出 opt。 

从 operandStack 对 象 中 弹出 opndl， 

从 operandStack 对 象 中 弹出 opnd2。 

将 opt、opnd2 和 opnd1 连 接 在 一 起 ， 然 后 将 结果 推 人 operandStack 对 象 。 

当 operatorStack 对 象 最 终 为 空 时 ，operatorStack 对 象 顶部 的 操作 数 (也 是 惟一 的 ) 将 是 对 


O 前 组 表示 法 是 由 一 个 波兰 逻辑 学 家 ，Jan Lucasiewica 创 造 的 。 有 时 会 称 它 为 波兰 表示 法 ， 而 后 组 又 称 作 反 
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例如 ， 如 果 开 始 的 表达 式 是 


那么 两 个 堆栈 的 历史 记录 如 下 : 


相应 于 原 字 符 串 的 前 组 字符 串 是 





a+b*c 
a 
1. 
infix 
+ 
2. 
infix 
b 
3. 
infix 
4. 
infix 
C 
5. 
infix 
6. 
infix 
7. 
infix 
+a*bc 


operandStack 


a 


operandStack 


b 


operandStack 


b 


operandStack 


C 
b 
a 


operandStack 


“bc 
& 


operandStack 
-a'bc 


operandStack 


举 一 个 更 复杂 的 例子 ， 假 设 中 组 字符 串 是 
a + (c - h)/(b*d) 


那么 在 第 一 个 右 插 号 的 处 理 过 程 中 ， 两 个 堆栈 的 项 如 下 : 


infix 


h 
C 
a 


g operandStack 


operatorStack 


+ 


operatorStack 


+ 


operatorStack 


+ 


operatorStack 


* 


+ 


operatorStack 


+ 


operatorStack 


operatorStack 


a, 


operatorStack 


229 





294 





已 到 过 了 中 组 表达 式 的 末尾 ， 因 此 operatorStack 对 象 重复 弹出 操作 。 


/—ch*bd 
a + 
4. 
operandStack operatorStack 
t a/ —ch*bd 
5. 
operandStack operatorStack 


Bil Sx: TT FB Js +-a/—ch*bd. 


CA = 
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-ch ( 
a + 
2. 
operandStack operatorStack 
一 Ch 
a 十 
3. 
operandStack operatorStack 
FEB 88 FF EB ASB AGES OSD RE , YES 
d * 
b ( 
—ch / 
) a + 
1. 
infix — operandStack operatorStack 
*bd ( 
—ch / 
a + 
2. 
operandStack operatorStack 
*bd 
一 Ch / 
a 十 
3. 
operandStack operatorStack 


队列 是 项 的 有 限 序列 ， 项 的 检索 、 删 除 和 修改 只 能 在 头 部 进行 ， 而 插入 只 能 在 尾部 进行 . 


这 个 公平 的 先 来 先 服 务 限制 使 得 queue 类 成 为 很 多 系统 的 一 个 重要 组 件 。 特 别 是 ，queue 类 在 
研究 这 些 系统 行为 的 计算 机 模型 的 开发 中 扮演 了 关键 的 角色 。 
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堆栈 是 项 的 有 限 序 列 ， 其 中 被 删除 、 检 索 或 修改 的 项 只 能 是 最 近 插入 序列 的 项 。 该 项 称 
作 位 于 堆栈 项 的 项 。 编 译 器 实现 递归 正 是 通过 生成 创建 和 维护 活动 堆栈 的 代码 来 实现 的 : 活 
动 堆栈 是 一 个 运行 时 堆栈 ， 它 保存 了 每 个 激活 函数 的 状态 。 另 一 个 堆栈 应 用 是 将 中 缀 表达 式 
转化 成 机 喜 代 码 。 通 过 运算 符 堆 栈 ， 可 以 很 容易 地 把 一 个 中 绥 表 达 式 转化 成 后 缀 表示 ， 也 就 
是 中 缀 表示 法 和 机 器 语言 的 中 间 形 式 。 


习题 
7.1 假设 定义 


queue<int> x; 
说 明 发 送 下 面 每 条 消息 之 后 队列 的 情况 : 


a. x.push(2000); 
b. x.push(1215); 
c. x.push(1035); 
d. x.push(2117); 


e. X.pop(); 
f. x.push(1999); 


g. X.pop(); | 
7.2 当 x 和 定义 如 下 时 ,重复 做 习题 7.1; 


stack<int> x; 


73 扩 展 实验 7 的 Linked 类 ， 使 得 它 可 以 作为 queue 容 器 配 接 器 的 基础 类 。 

74 习题 7.3 的 扩展 Linked 类 能 不 能 作为 stack 容 器 配 接 器 的 基础 类 ? 解释 原因 . 

7.5 回想 前 面 ,“deque” 代 表 “ 双 端 队 列 *， 也 就 是 说 ， 一 个 既 克 许 在 头 部 又 允许 在 尾部 
进行 插入 、 删 除 和 检索 操作 ( 且 仅 需要 常数 时 间 ) 的 队列 。 双 端 队列 还 有 什么 显著 特 
点 ? 如 果 在 定义 deque 类 之 前 定义 queue 类 ， 为 什么 它 会 和 标准 模板 库 是 矛盾 的 ? 

7.6 假设 依次 将 8、b、c、d、e 推 人 一 个 最 初 为 空 的 堆栈 。 然后 这 个 堆栈 弹出 4 次 ， 每 当 一 

”个 项 从 堆栈 中 弹出 ， 就 将 其 插入 一 个 最 初 为 空 的 队列 。 如 果 接 着 从 队列 中 删除 一 项 
那么 下 一 个 即将 被 删除 的 是 哪 一 项 ? 

7.7 queue 类 能 耕作 为 stack 类 的 基础 类 ? 请 解释 原因 


提示 基础 类 必须 提供 什么 方法 ? 


7.8 使 用 一 个 活动 记录 堆栈 ， Cot coil Z RE 归 阶 乘 方法 的 运 运行 。 
79 将 下 列表 达 式 转化 成 后 缀 表示 : 
a. X 4 y*z 
b. (x + y)*z 
C. X - y - z*(a+b) 
.. d. (a+ b)*c ~ (d + e*t/((g/h + i - j)*k)yr 
7.10 将 习题 7.9 的 表达 式 分 别 转化 成 前 级 表示 。 
7.1 一 个 后 缀 表示 的 表达 式 可 以 依靠 堆栈 在 运行 时 求 值 。 为 简化 起 见 ， 假 设 后 绿 表 达 式 
人 由 吕 数值 和 一 元 运算 符 组 成 ， 例如 ， 可 能 有 下 面 的 后 组 表达 式 : 
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求 值 过 程 如 下 : 当 遇 到 一 个 数值 时 就 将 它 推 人 堆栈 。 当 遇 到 一 个 运算 符 时 ， 取 出 
堆栈 的 第 一 个 和 第 二 个 项 , 应 用 运算 符 (第 二 个 项 是 左 操作 数 ,第 一 个 项 是 右 操作 数 )， 
并 将 结果 推 人 堆栈 。 后 级 表达 式 处 理 完 后 ， 这 个 表达 式 的 值 就 是 栈 顶 的 项 (也 是 惟 
296 一 的 )。 
例如 ， 对 前 面 给 出 的 表达 式 ， 堆 栈 的 内 容 变 化 如 下 : 
4 
5 5 
8 8 8 
9 7 
8 ?2 72 65 
He RRC Laide. IM est ORIEL: 
5 + 2*(30 — 10/5) 
29] — 7.2 queue 类 和 stack 类 都 没有 定义 析 构 器 ， 缺 少 这 些 会 不 会 导致 内 存 泄漏 ? 解释 原因 。 


编程 项 目 7.1: 扩展 洗车 仿真 


全 Speedo 的 洗车 仿真 更 接近 现 

分 析 

根据 泊 松 分 布 ， 到 达 时 间 应 当 由 平均 到 达 时 间 随 机 产生 。Speedo 增 加 了 一 个 新 的 特点 : 
服务 时 间 不 必 是 10 分 钟 ， 但 依赖 于 顾客 的 需要 ， 像 只 清洗 、 清 洗 加 打 蜡 或 是 清洗 并 吸 尘 。 — 
辆 车 的 服务 时 间 应 当 在 开始 清洗 它 之 前 计算 出 来 ， 也 就 是 从 顾客 了 解 将 花费 多 少时 间 直 到 他 
离开 洗车 处 为 止 。 服 务 时 间 也 是 一 个 泊 松 分 布 ， 应 当 由 平均 服务 时 间 随 机 产生 。 

平 习 等 待 时 间 和 平均 队列 长 度 都 计算 到 一 个 小 数位 。 平均 等 待 时 间 是 等 待 时 间 的 总 和 除 
以 顾客 的 数量 。 | 

平均 队列 长 度 是 仿真 中 每 分 钟 队列 长 度 的 总 和 除 以 直到 最 后 一 个 顾客 离开 所 经 过 二 的 分 钟 
数 。 为 了 计算 队列 长 度 的 总 和 ， 对 仿真 的 每 一 分 钟 ， Fe NG — FP BEA AD BEC RU Eth 
可 以 用 另 一 一 种 万 式 计算 这 个 总 和 1: 对 每 个 顾客 累加 他 在 队列 中 的 分 钟 数 总 和 。 但 是 这 是 等 待 
时 间 的 总 和 ! 因此 可 以 将 平均 队列 长 度 计 算 为 等 待 时 间 的 总 和 除 以 直到 最 后 一 个 顾客 离开 时 
仿真 经 过 的 分 钟 总 数 。 而 且 已 经 在 平均 等 待 时 间 中 计算 了 等 待 时 间 的 总 和 。 

同 理 可 以 计算 溢出 的 数量 。 使 用 500 作 为 随机 数 生成 器 的 种 子 。 

系统 测试 1 (输入 用 黑体 表示 ) 

Please enter the mean arrival time:3 


Please enter the mean service time:5 
298 Please enter the maximum arrival time:25 e 


MOM | s om" 等 待 时 间 
一 ~- 有 
! 到 达 
4 到 达 


I II 





(£&) 
时 fal x fF 等 待 时 间 

6 到 达 

7 离开 0 

7 到 达 

7 到 达 

8 离开 3 

11 离开 

14 离开 4 

15 BIA 

15 到 达 

17 i JT 7 

20 到 达 

24 离开 2 

24 到 达 

25 离开 9 

27 离开 5 

36 离开 3 

— SULLA 

平均 等 待 时 间 是 3.9 分 钟 。 
平均 队列 长 度 是 1.0 辆 车 。 
üt i RERO. 


系统 测试 2 (输入 用 黑体 表示 ) 


Please enter the mean arrival time:8 
Please enter the mean service time:5 
Please enter the maximum arrival time:20 


Rt dd 事 ft 等 待 时 间 
eee 
3 到 达 l 
9 离开 0 
10 到 达 
12 到 达 
13 离开 0 
13 到 达 
14 离开 1 
17 离开 | l 
eee 
平均 等 待 时 间 是 0.5 分 钟 。 
平均 队列 长 度 是 0.1 辆 车 。 
溢出 数量 是 0。 


编程 项 目 7.2: 求 一 个 条 件 的 值 


开发 一 个 程序 求 条 件 的 值 。 
分 析 
输入 将 由 一 个 条 件 ( 即 一 个 布尔 表达 式 ) 和 后 面 每 行 一 个 的 数值 组 成 ， 数值 分 别 代 表 条 


bo 
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件 中 各 个 变量 的 值 。 例 如 : 


b*a>a+C 
6 
2 


7 


变量 b 得 到 值 6，a 得 到 2， 且 c 得 到 7。 运 算 符 * 优 先 级 比 > 高 ， 而 且 + 的 优先 级 , 比 > 高 ， 因 
此 表达 式 的 值 为 true (12 大 于 9)。 d 

每 个 变量 都 以 仅 由 小 写字 母 组 成 的 标识 符 形式 给 出 。 所 有 的 变量 必须 都 是 整数 值 。 这 里 
没有 直接 常量 。 合 法 的 运算 符 和 优先 级 从 高 至 低 分 别 是 

n 

+, — ( 即 整数 加 法 和 减法 ) 


> 





&& 
II j 


括号 括 起 来 的 子 表 达 式 是 合法 的 。 不 需要 任何 输入 编辑 。 

系统 测试 1 
b*a>ate | 
Please enter a value. 







A oa PON 





ewe. -— - run, 
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提示 参阅 实验 19 和 习题 7.11 里 中 级 到 后 级 的 转化 。 构 造 后 级 队列 之 后 ， 创 建 一 个 
int 项 的 向 量 Values 对 应 标识 符 向 量 symbolTable。 还 要 创建 int 项 的 












推 入 和 弹出 int 和 bool 类 型 的 数值 (回想 一 下 ，false 和 0 是 同 义 的 ， 而 true 和 1 是 同 
义 的 )。 


编程 项 目 7.3: 一 个 迭代 的 迷宫 搜索 
重 做 第 4 章 的 迷宫 搜索 项 目 ， 将 tryToSolve 方 法 替换 成 一 个 模拟 递归 的 迭代 方法 。 
提示 使 用 堆栈 模拟 对 tryToSolve 的 递归 调用 。 
项 目的 原始 版 本 可 参阅 本 书 网 站 上 的 源 代 码 链 接 。 
编程 项 目 7.4: queue 类 的 另 一 个 设计 
7.1.4 市 中 描述 了 queueArray 类 的 实现 。 包 含 了 一 个 驱动 器 来 验证 类 。 
提示 。 惟一 的 复杂 情况 出 现在 调用 push_back 方 法 且 queueArray 占 据 了 全 部 的 data 数 
组 ， 即 Size=max_size 时 ， 或 者 (tail+1)%max_size=head 时 也 是 一 样 的 。 然 后 应 当 创 
建 一 个 两 倍 data 大 小 的 数组 ， 并 将 旧 数 组 拷贝 到 这 个 新 数组 里 。 首 先 ， 找 贝 下 标 
head 和 旧 数 组 尾部 之 间 的 项 ,从 下 标 0 开 始 。 如 果 head=0, 那么 再 没有 什么 可 找 贝 的 。 
否则 ， 将 旧 数 组 中 剩 下 的 项 (下 标 0...tai]) 拷贝 到 新 的 数组 ， 从 前 一 个 拷贝 结束 位 
置 之 后 开始 。 
通用 型 算法 copy 可 以 简化 工作 。 回 忆 一 下 ， 通 用 型 算法 既 能 操作 数组 又 能 操作 容器 对 象 
例如 ， 为 了 将 oldDatafhead,….max_size- 1 中 的 每 一 项 拷贝 到 data[0...max_size-head]: 
copy(oldData + head,oldData + max_size,data); 


对 push_back 和 pop_front 方 法 ， 使 用 模 算 法 。 例 如 ， 将 


if(head==max_size) 
head=0; 

else 
head++; 


替换 成 等 价 的 


head=(head+1)%max_size; 


t2 
© 
m 





第 8 章 ”二 又 树 和 折 半 查找 树 


本 章 从 第 2、$、6、7 章 中 的 线性 结构 中 延伸 出 了 “分 枝 ， 介 绍 一 个 二 维 的 概念 : 二 又 树 。 
在 对 二 又 树 的 定义 和 性 质 有 一 定 了 解 之 后 ， 将 去 认识 一 个 特殊 类 型 的 二 又 树 一 一 折 半 查找 树 ， 
它 的 项 是 遵守 某 种 顺序 的 。 

折 半 查找 树 是 很 吸引 人 的 数据 结构 ， 因 为 它们 在 平均 情况 下 的 插入 、 删 除 和 查找 都 只 需要 
对 数 时 上 间 (但 是 在 最 坏 情况 下 需要 线性 时 间 ) 花费 。 这 个 性 能 要 远 胜 于 数组 、 向 量 或 列表 结构 
中 在 平均 情况 下 的 插入 、 删 除 和 查找 的 线性 时 间 花 费 。 例 如 ， 当 n=1 000 000 时 ，logzn<20。 

本 章 使 用 了 一 个 不 在 标准 模板 库 类 中 的 BinSearchTree 类 来 实现 折 半 查找 树 的 数据 结构 。 
学 习 BinSearchTree 类 的 主要 原因 是 它 是 第 9、10 音 的 AVLTree 和 rb_tree 类 的 简化 版 本 。 它 们 是 
“平衡 ”的 折 半 查找 树 ， 其 高 度 总 是 和 n 成 对 数 关 系 。 这 表示 对 于 插入 、 删 除 和 查找 ， 
worstTime(n) 和 n 是 成 对 数 关 系 的 。 在 第 11 章 中 探讨 了 另外 两 种 类 型 的 二 又 树 一 一 堆 和 霍 夫 曼 
树 ， 在 第 12 章 中 将 学 习 决 策 树 。 本 章 的 素材 将 有 助 于 读者 更 好 地 理解 第 9~12 章 中 的 树 。 
目标 

1) 理解 二 又 树 的 概念 和 重要 属性 ， 像 二 叉 树 定理 和 外 部 路 径 长 度 定理 。 

2) 能 够 在 一 个 二 叉 树 中 进行 各 种 遍历 。 | 

3) 比较 BinSearchTree 类 的 insert、erase 方 法 和 vector、deque 以 及 list 类 的 相应 方法 的 时 间 

效率 。 | 

4) 讨论 BinSearchTree 类 的 find 方 法 和 通用 型 算法 find 以 及 binary_search 的 相同 点 和 不 同 点 ，。 


8.1 定义 和 属性 


一 个 递归 的 定义 。 
下 面 的 定义 确定 了 整 章 的 基调 : 









一 叉 树 /要 么 为 空 ， 
树 和 右 子 树 ) 组 成 。 








要 么 由 一 项 ( 称 作 根 项 ) 和 两 个 不 相交 的 二 又 树 〈 称 作 ;的 左 子 


我 们 将 这 些 子 树 分 别 表示 成 leftTree(D 和 rightTree(D 。 采 用 函数 表示 法 leftTree(D) 人 代替 对 象 
“表示 法 tleftTree(0)， 是 因为 没有 二 叉 树 这 个 数据 结构 。 为 什么 没有 了 昵 ? 因为 对 像 插 入 和 删除 之 
类 的 操作 ， 有 众多 不 同 的 方法 (甚至 是 不 同 的 参数 列表 ) 用 于 不 同类 型 的 二 叉 树 。 注 意 二 又 
树 的 定义 是 递归 的 ， 并 且 大 多 数 和 二 叉 树 关联 的 定义 天 生 就 是 递归 的 。 

在 描绘 一 个 二 叉 树 时 ， 根 项 习惯 上 画 在 顶部 。 为 了 说 明 根 项 和 左 、 右 子 树 的 关系 ， 画 一 条 
从 根 项 到 左 子 树 的 西南 向 的 线 以 及 一 条 从 根 项 向 右 子 树 的 东南 向 的 线 。 图 8-1 显 示 了 几 个 二 又 树 。 

图 8-1a 中 的 二 又 树 和 图 8-1b 中 的 二 叉 树 是 不 同 的 ， 因 为 B 是 图 8-1a 中 的 左 子 树 ， 而 不 是 图 
8-1b 的 左 子 树 。 本 书 第 14 章 中 将 会 讲 到 ， 当 把 这 两 个 树 看 作 一 般 的 树 时 ， 它 们 是 等 价 的 。 
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二 又 树 的 一 个 子 树 自 身 也 是 二 又 树 ， 因 此 图 8-1a 中 有 7 个 二 又 树 : 整个 的 二 又 树 ， 以 B 为 根 
的 二 叉 树 ， 以 C 为 根 的 二 叉 树 以 及 四 个 空 的 二 叉 树 。 试 着 计算 一 下 图 8-1d 中 的 子 树 的 总 数量 。 

植物 学 术语 : TR, WAL, Met. 

从 根 到 子 树 的 线 称 作 是 树枝 。 一 个 相关 的 左 子 树 和 右 子 树 均 为 空 的 项 称 作 树叶 。 树 时 上 
役 有 同 下 连接 的 树枝 。 图 8-1e 所 示 的 二 又 树 中 有 四 个 树叶 : 15，28，36 和 68。 可 以 递归 求 出 
一 个 二 又 树 中 树叶 的 数量 。 令 t 是 一 个 二 又 树 ，t 中 树叶 的 数量 记 为 leaves(t)， 可 以 做 如 下 递归 
定义 : 

MARIA e 

leaves(t)=0 

否则 如 果 ! 只 由 一 个 根 项 组 成 

leaves(t)z] 

否则 


leaves(t)=leaves(leftTree(?t))+leaves(rightTree(?t)) 





图 8-1 几 个 二 叉 树 
这 是 一 个 数学 上 的 定义 ， 而 不 是 C++ 的 方法 。 定义 的 最 后 一 行 说 明 t 中 树叶 的 数量 等 于 的 


CEE B 


从 要 看 看 整个 树 就 能 计算 出 树叶 的 数量 ， 不 过 这 个 定义 是 原子 的 而 不 是 整体 的 。 
二 又 树 的 每 一 项 都 可 以 由 它 在 树 中 的 位 置 惟一 地 确定 。 例 如 ， 令 十 图 8-1c 中 的 二 又 树 ， 
它 有 两 项 的 值 是 “- ` 。 要 区 分 它们 ， 可 以 称 其 中 一 个 是 “ 值 为 “- ”而 位 置 在 :的 根 的 项 *， 而 








=A fo FESR | 241 


另 一 个 是 “ 值 为 “- ， 而 位 置 在 ! 的 左 子 树 的 右 子 树 的 根 的 项 *。 不 严格 地 讲 ， 可 以 说 是 一 又 树 
中 的 “ 某 项 ”， 而 严格 来 讲 ， 要 称 位 于 某 菜 位 置 的 “项 ”。 

ZARE: LH, Fe, LH. 

Ate a PY RB: 


x 


/\ 


» z 


那么 称 x 是 y 的 父亲 而 y 是 x 的 左 子 女 。 相 似 地 ， 称 x 是 z 的 父亲 而 z 是 x 的 右 子 女 。 在 一 个 二 又 
树 中 ， 每 个 项 都 有 0 个 、1 个 或 2 个 子女 。 例 如 ， 在 图 8-1d 中 ，24 有 两 个 子女 ，16 和 13; 16 仅 有 
一 个 子女 52; 13 和 52 都 没有 子女 ， 也 就 是 说 ， 它 们 是 树叶 。 对 树 中 的 任意 项 w， 将 w 的 父亲 记 
为 parent(w)，w 的 左 子 女 记 为 left(w)，w 的 右 子 女 记 为 right(w)。 

二 叉 树 中 的 根 项 没有 父亲 ， 而 其 他 的 每 个 项 都 有 一 个 父亲 。 继 续 采 用 家 族 术 语 可 以 定义 
兄弟 、 祖 父 、 孙 子 、 第 一 代 堂 兄弟 、 祖 先 和 后 代 。 例 如 ， 如 果 B 是 根 项 为 4 的 子 树 中 的 一 项 ， 
那么 项 4 就 是 项 B 的 祖先 。 递 归 地 说 ， 如 果 parent(8)=A4 或 者 A 是 parent(8) 的 祖先 ， 那 么 4 就 是 B 
的 祖先 。 

如 有 果 4 是 8B 的 一 个 祖先 ， 那 么 从 A 到 8B 的 路 径 就 是 从 A 开始 到 B 的 项 的 序列 ， 序 列 中 的 每 一 

项 (除了 最 后 一 个 ) 都 是 下 一 项 的 父亲 。 例 如 ， 在 图 8-le 中 ， 序 列 37，25 ，30 和 32 是 37 到 32 

非 形式 化 地 说 ， 二 又 树 的 高 度 是 根 和 最 远 的 树叶 〈 即 祖先 最 多 的 树叶 ) 之 间 的 树枝 数量 。 
例如 ， 下 面 是 一 个 高 度 为 3 的 二 又 树 : 


这 个 树 的 高 度 为 3， 因 为 从 E 到 5 的 路 径 上 有 三 个 树枝 。 假 设 某 些 二 XH, 它 的 左 子 树 高 度 

为 12， ， 醒 右 子 树 高 度 为 20， 那么 整个 树 的 高 度 是 多 少 ? 答案 是 21。 
二 又 树 的 高 度 是 一 1。 

ne 二 又 树 的 高 度 比 左 子 树 和 右 子 树 的 最 大 高 度 大 1。 这 可 以 给 出 一 个 二 又 树 高 度 
的 递归 定义 。 但 是 首先 需要 知道 基本 情况 是 什么 ， 即 空 树 的 高 度 。 我 们 希望 单个 项 的 树 的 高 
度 是 0: 没有 从 根 项 出 发 的 树枝 ; 也 就 是 左右 子 树 均 为 空 。 但 是 如 果 0 是 比 空子 树 高 度 多 1 的 数 ， 
那 就 需要 将 一 个 空子 树 的 高 度 定 义 成 更 奇怪 的 -1。 

令 t 是 一 个 二 又 树 ， 将 {的 高 度 height() 定 义 如 下 : 
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如 果 ! 为 空 ， 

height(#)=— 1 

否则 

310 height(7)214 maximum of{height(leftTree(t)) height(rightTree(r)) } 

这 个 定义 表明 了 只 有 一 个 项 的 二 又 树 高 度 为 0， 因 为 它 的 每 个 空子 树 的 高 度 是 -1。 同 理 ， 
图 8-1a 中 二 又 树 的 高 度 是 1， 图 8-le 中 二 又 树 的 高 度 是 5。 

高 度 是 整个 二 又 树 的 属性 。 二 又 树 的 每 一 项 可 以 定义 一 个 相似 的 概念 : 项 的 层次 。 非 形 
式 化 地 说 : 给 定 项 的 层次 是 根 项 和 它 之 间 的 树 术 数量。 例如， 下 面 是 一 个 二 又 树 ， 它 的 层次 


如 图 所 示 : 
Bik 
E 0 
一 人 | 
Ld LCS, 2 


/ 


注意 根 项 的 层次 是 0， 而 树 的 高 度 等 于 该 树 中 的 最 高 层次 。 现 在 给 出 一 个 形式 化 的 定义 。 
令 t 是 一 个 非 空 二 又 树 ， 对 中 的 任意 项 x， 定 义 level(x) 如 下 : 
如 果 x 是 根 项 ， 
level(x)=0 
否则 
level(x)=1+level(parent(x)) 
”项 的 层次 也 称 作 是 项 的 深度 。 一 个 非 空 二 又 树 的 高 度 是 最 远 的 树叶 的 深度 |! 
二 - 树 是 这 样 一 一 种 一 又 树 : 它 要 么 为 空 ， 要么 每 个 非 叶 节点 连接 两 条 向 下 延伸 的 树枝 。 例 
如 ， 图 8-2a 是 一 个 二 - 树 ， 而 图 8-2b 就 不 是 二 - 树 。 递 归 地 说 ， 二 又 树 t 是 一 个 二 ~- 树 ， 当 
1 为 空 
或 者 : 
! 的 两 个 子 树 为 空 或 ! 的 两 个 子 树 都 是 非 空 二 - 树 。 
| ZARAMA: 是 指 t 是 所 有 树叶 都 在 同一 层 上 的 二 - 树 。 例 如 ， 图 8-3a 是 满 树 ， 而 图 
8-3b 则 不 是 满 树 。 递 归 地 说 ， 二 又 树 :是 满 树 ， 当 
1 为 空 
或 者 
311 ! 的 左右 子 树 高 度 相 同 而 且 都 是 满 树 。 
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a) 


图 8-2 a) 一 个 二 - 树 ; b) 一 个 不 是 二 - 树 的 二 又 树 


50 50 


a) b) 
图 8-3 a) 一 个 满 二 又 树 ; b) 一 个 不 满 的 二 叉 树 


当然 ， 每 个 满 二 又 树 都 是 二 - 树 ， 但 是 反 过 来 就 未 必 成 立 。 例 如 ， 图 8-3b 是 一 个 二 - 树 ， 
但 不 是 满 树 。 对 满 二 又 树 来 说 ， 在 树 的 高 度 和 项 的 数量 之 间 有 一 个 关系 。 例 如 ， 如 果 满 二 又 
树 高 度 为 2， 那 么 该 树 必 定 恰好 有 7 项 : 


Al 
u | A2. 3 | 
A4 A5 A6 A7 


高 度 为 3 的 满 二 又 树 中 有 多 少 项 ? 高 度 为 4 的 呢 ? PR RB 能 不 能 为 :中 项 的 数量 
ier ioe ueri m 
” 化“ 满 ”稍微 弱 一 些 的 表示 是 “完全 "。 当 二 -又 树 在 heightO)- 1 县 次 上 为 满 且 最 低层 的 全 
部 树叶 尽 可 能 向 左 排列 时 ， 就 称 它 是 完全 的 .“ 最 低层 ”是 指 距 离 根 最 远 的 层次 。 
任何 满 二 叉 树 都 是 完全 的 ， 但 并 非 所 有 完全 二 叉 树 都 是 满 的 。 图 8-4 显 示 了 几 个 二 又 树 。 
例如 ， 图 8-4a 是 一 个 完全 二 又 树 但 不 是 满 二 又 树 。 图 8-4b 中 的 树 不 是 完全 的 ， 因 为 C 只 有 一 个 
了 于 女 。 图 8-4c 中 的 树 也 不 是 完全 的 ， 因 为 树叶 1 和 J 并 没有 尽 可 能 地 向 左 排列 。 








244 | | REF 


人 VN 入 
AA I / AN 
M AN /入 


图 8-4 二 个 二 又 树 ， 其 中 只 有 a) 是 完全 的 
在 一 个 完全 二 叉 树 中 可 以 为 每 一 项 关联 一 个 索引 。 根 项 分 配 的 索引 是 0。 对 任意 正 整数 i 
如 果 索 引 i 上 的 项 有 子女 ， 那 么 它 的 左 子 女 索 引 是 2i+1， 右 子女 的 索引 是 2i+2。 例 如 ， 如 果 完 
全 二 叉 树 有 10 项 ， 那 么 这 些 项 的 索引 如 下 : 


0 


pe 
“N A 
/N / 


RII LAV LPR, TRS ERUJRIU SC ETT 35912. ARE, ARLE 
[313] 个 正 整 数 ， 那 么 索引 上 的 项 的 父亲 位 于 索引 (i- 1/2. | 
项 的 索引 是 很 重要 的 ， 因 为 据 此 我 们 可 以 将 一 个 完全 二 又 树 的 项 存 人 一 个 数组 。 具 体 地 
讲 ， 就 是 把 在 树 中 索引 上 的 项 就 存 到 数组 中 索引 为 揭 位 置 。 例 如 ， 下 面 是 保存 了 图 8-4a 中 项 
的 数组 : 





实际 上 ， 所 要 做 的 (在 第 11 章 中 ) 就 是 把 项 存 人 数组 ， 然 后 访问 这 些 项 ， 就 好 像 它们 仍 
然 在 一 个 完全 二 叉 树 中 一 样 。 因 此 完全 二 又 树 是 可 以 用 数组 实现 的 一 种 抽象 形式 。 大 部 分 访 
问 将 是 从 父亲 的 索引 到 子女 的 索引 ,或 是 从 子女 的 索引 到 父亲 的 索引 。 不 仅 可 以 快速 计算 出 
这 些 索 引 ”， 而 且 由 于 数组 的 随机 访问 属性 ， 也 能 够 快速 地 读 取 相应 的 项 。 | 

BE CST ANE LE X bibo MER if) v MEheight(r). HH, 
PER H EERIE; | 

MRAB | 0. 

n(t)=0 — 


在 位 级 别 上 ， 比 如 ， 对 ;进行 一 个 左 移 位 然后 加 1 就 能 得 到 2i+1 的 数值 。 这 是 很 快 的， 是 机 器 层 的 操作 ， 














否则 
n(t)=1+n (leftTree(t)+n(rightTree(t)) 
8.1.1 二 叉 树 定理 


对 任意 二 叉 树 :，leaves(1) < n(t)， 且 leaves(t)=n(t) 当 且 仅 当 1 只 由 一 项 组 成 时 。 下 面 的 定理 
zimi f leaves(t), height Fm OZ ARA. 


二 义 树 定理 MLE XB, 


1) leaves(t) < nt) +1 
nit)cl heighi(r)} 
2) 2 
3) 如 果 十 一 个 二 - 树 ， 那 么 leaves(t) = nowt 
4) 如 果 leaves(r) = "2*1 Oe ， 那 么 十 一 个 二 - 树 ， 


5) 如 果 t 是 满 树 ， 那 么 CN prion 


“Oe 


6) 如 果 一 一 一 = 2**"”， 那 么 t 是 满 树 。 


注意 因为 二 又 树 定理 中 等 式 的 分 母 是 2.0， 所 以 商 是 一 个 浮 点 数 。 例 如 ，7/2.0=3.5。 
不 能 使 用 整数 除法 是 因为 定理 的 第 4 部 分 。 令 ! 是 下 面 的 二 又 树 : 


在 这 个 树 中 ， leaves(*=(n(0)#1)/2. 但 是 ! 不 是 二 -~ 树 。 - 

定理 的 这 6 个 部 分 都 可 以 用 t 的 高 度 进行 归纳 证 明 ， 附录 1 给 出 了 一 些 详细 情况 ， Au 
明 一 致 ， 大 部 分 有 关 二 又 树 的 定理 都 可 以 用 树 的 高 度 进行 归纳 证 明 。 原 因 是 如 果 ! 是 一 个 
树 ， 那 么 leftTree() 和 rightTree(?) 的 高 度 都 小 于 height(z)， 因 此 往往 就 可 以 采用 数学 归纳 法 。 " 
如 ， 下 面 给 出 了 二 又 树 定理 的 第 2 部 分 的 证 明 (附录 1 的 例 5 是 第 1 部 分 的 证 明 ): 

证 明 对 k=0,1,2,.….， 令 5 是 语句 : 

如 果 t 是 高 度 为 的 二 又 树 ， 


n(t)+1 beight(r) 
那么 0 < 2 
1) 基本 情况 。 如 果 k=0， 那 么 只 有 一 个 项 ， 因 此 


n(t) +1 一 _1+1 一 1 = 2° 二 o height(1) 
2.0 20 





4A 





6 <E 


BSAA. | 
2) 归纳 情况 。 令 Kk 是 任意 非 负 整数 ,假设 $6,91,...,$; 为 真 。 令 tf 是 高 度 为 Kt1 的 二 又 树 。t 中 的 
任意 一 项 要 么 是 根 ， 要 么 是 左 子 树 或 右 子 树 。 也 就 是 说 ， 
n(t) = l4n(leftTree(t))+n(rightTree(t)) 


因此 有 | 
n(t)*tl  1+n(leftTree(t)) + n(rightTree(t)) + 1 
20 | 2.0 
_ n(leftTree(t)) + 1 n n(rightTree(t)) + 1 
2.0 2.0 

leftTree(t)#llrightTree(t)ix PA i REAP) Fheight(s), AlitleftTree(s)F#irightTree(t)@he <k 

的 ， 应 用 归纳 假设 ， 即 ， 
n(leftTree(1)) +1 4 n(rightTree(r)) tl < 

315 2.0 2.0 

ix hmax Aheight(leftTree(s)) Filheight(rightTree(t) MAA. AZ 


7) beighi(lehTree(1)) 十 2) heightirightTree(t) < Dh max 十 2hma — 2h max __ n height(n) 


根据 前 面 的 等 式 和 不 等 式 可 以 得 到 
na)yvl 
2.0 . 
这 就 验证 了 归纳 情况 是 正确 的 。 综 上 所 述 ， 根 据 数学 归纳 原理 ， 对 任 音 非 空 二 又 树 :， 二 
又 树 定理 的 第 2 部 分 都 是 成 立 的 。 
满 二 又 树 的 高 度 和 树 中 项 的 数量 n 成 对 数 关系 。 
如 果 1 是 一 个 满 二 又 树 ， 那 么 根据 二 又 树 定理 以 及 任意 空 树 高 度 为 -1， 可 以 推断 
| height(t) = log,((n(t)+1)/2.0) 
= log,(n(t)+1)- 1 
链 的 高 度 和 树 中 项 的 数量 A 成 线性 关系 。 
因此 可 以 说 一 个 满 树 的 高 度 是 和 n 成 对 数 关系 的 ， 其 中 n 是 树 中 项 的 数量 ( 当 所 指 的 树 很 明确 
时 ,通常 可 以 用 “代替 m(D)。 即 使 上 只是 完全 树 ， 它 的 高 度 也 是 和 "成 对 数 关系 的 。 参 见习 题 87。 另 
316| ”一 方面 ，! 可 能 是 一 个 链 。 链 是 每 个 非 叶 节 点 都 恰好 有 一 个 子女 的 二 叉 树 。 例 如 下 面 就 是 一 个 链 - 


2 height (leftTree(1)) + 2 height(rightTree (1)) 


< 2 height{r} 
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如 果 t 是 一 个 链 ， 那 么 height(t)=n(1)-1， 因 此 链 的 高 度 和 n 是 成 线性 关系 的 。 第 9 和 第 10 
章 中 有 关 树 的 工作 都 是 围绕 着 如 何 保持 对 数 高 度 以 及 避免 线性 高 度 展开 的 。 基 本 上 ， 在 一 - 
个 高 度 和 nn 成 对 数 关 系 的 二 又 树 中 进行 插入 和 删除 的 worstTime(n) 和 n 也 是 成 对 数 关 系 的 。 
这 也 是 之 所 以 在 很 多 应 用 中 树 更 适宜 于 顺序 容器 的 原因 。 例 如 ， 假 设 要 将 项 按 顺 序 存储 在 
容 占 中， 那么 使 用 向 量 、 双 端 队 列 和 和 链表 插入 或 删除 指定 项 的 worstTime(n) 和 nn 是 成 线性 关 
系 的 。 


8.1.2 外 部 路 径 长 度 


读者 可 能 会 奇怪 我 们 为 什么 对 从 根 到 树叶 的 路 径 长 度 的 总 和 感 兴 趣 ， 但 是 下 面 的 定义 是 
有 很 大 实践 意义 的 。 令 :是 一 个 非 空 二 叉 树 。; 的 外 部 路 径 长 度 E(D 是 上 中 所 有 树叶 的 深度 训 和 。 
例如 在 图 8-5 中 ， 树 叶 的 深度 总 和 是 2+4+4+4+5+5+1=25。 


8 
| m 
图 8-5 外 部 路 径 长 度 是 25 的 二 又 树 | 
下 面 的 外 部 路 径 长 度 的 下 界 将 得 出 排序 算法 中 的 一 个 重要 结论 (参见 第 12 章 )。 





外 部 路 径 长 度 | 
4 UE Kk (k50) Abo HA RH, MZ | 
E(t) > (k/2)floor(log,k) — 317 


WE RA 令 1 是 有 K 个 树叶 的 二 叉 树 ， Kk>0。 对 任意 层次 L， 在 L 层 上 树叶 的 最 大 数量 是 2: 
(这 很 容易 用 数学 归纳 法 证 明 )， 而 且 只 有 当 t 满 时 树叶 数量 才 是 27。 
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因此 ， 所 有 《< 工 的 层次 上 树叶 的 最 大 数量 仍然 是 2:+， 因 为 在 小 于 上 的 层次 上 的 任何 树 
叶 都 不 能 构成 一 个 满 树 。 在 使 用 floor(logzk) 一 1 赤 挽 L 时 ， 由 于 2"”*=k， 故 所 有 小 于 等 
于 人 foor(log2k) 一 1 的 层次 上 的 树叶 的 最 大 数量 是 


2) floor(log3)- 1 < 2 log;sk- 1 = k/2 


BVA X Ffloor(log;)- 1 的 全 部 层次 上 的 树叶 的 最 小 数量 至 少 是 112。 也 就 是 说 ， 全 部 
大 于 等 于 身 oor(logsk) 的 层次 上 的 树叶 的 最 小 数量 至 少 为 k/2。 而 每 个 这 样 的 树叶 至 少 
为 外 部 路 径 长 度 贡 献 floor(logyk)， 因 此 有 


E(t) > (k/2)floor(log,k) 


注意 在 第 12 章 中 还 需要 用 到 这 个 结论 ， 但 是 通过 一 个 更 复杂 的 证 明 过 程 , 可 以 说 明 : 
对 任何 包含 k 个 树叶 的 非 空 二 - 树 ，E(D) > klog,k。 详 情 可 参阅 Kruse(1987, pp. 171- 
178), 


8.1.3 二 又 树 的 遍历 


二 又 树 {的 遍历 是 一 个 算法 ， 它 访问 中 的 每 一 项 且 只 访问 一 次 。 这 里 没有 BinaryTree 类 : 
它 不 够 灵活 ， 不 能 支持 标准 模板 库 里 和 二 叉 树 相关 的 数据 结构 中 的 各 种 插入 和 删除 方法 。 因 
此 下 面 的 算法 不 是 方法 。 下 面 指出 了 四 种 不 同 的 遍历 。 

遍历 1。 中 序 (inOrder) WH: 左 - 根 - 右 假设 十 一 个 二 叉 树 ， 以 下 是 算法 : 

inOrder(t) 


( 
if(t4F zs) 
( | 
inOrder(leftTree(t)); 
访问 t 的 根 项 ; 
inOrder(rightTree(t)); 
Vit | 
H/ 中 序 遍 历 


在 每 次 递归 调用 中 访问 一 项 。 如 果 n 代 表 树 中 项 的 数量 ， 那 么 worstTime(n) 就 是 和 n 成 线性 
318] 关系 的 。 可 以 使 用 这 个 递归 描述 列 出 下 面 二 又 树 : 在 中 序 遍历 中 的 项 : 


42 25 


树 夺 E 空 ， 因 此 可 以 开始 执行 leftTree(n) 的 中 序 遍 历 ， 即 
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47 | 
这 只 包含 一 个 项 的 树 成 为 的 当前 值 。 因 为 它 的 左 子 树 为 空 ， 所 以 访问 这 个 的 根 ， 即 47; 
这 样 就 完成 了 这 个 t 的 遍历 ， 因 为 rightTree(?) 也 是 空 。 现 在 再 一 次 指向 原先 的 树 。 下 一 个 要 访 
问 的 是 的 根 项 ; 即 


31 
然后 ， 执 行 rightTree( 力 的 中 序 遍 历 ， 即 
50 - 
42 25 
这 成 为 的 当前 值 。 那么 先 执行 f3leftTree(DR b IF XE. Bl, 
42 


现在 这 个 只 包含 一 个 项 的 树 成 为 :的 当前 值 。 因 为 —] 所 以 访问 的 根 项 42。 
这 个 的 右 子 树 也 是 空 。 因 此 对 这 个 树 的 中 序 遍 历 就 是 访问 这 个 惟一 的 项 42， 现 在 1 再 一 次 地 指 
问 包 含 三 个 项 的 二 叉 树 : 


50 
V 4 AMAT | 28 .. 
下 一 个 将 访问 这 个 的 根 项 ， 即 ， 
50 
最 后 ， 执 行 rightTree(#) 的 中 序 遍历 ， 即 "i 
25 


因为 这 个 RS MN EM 所 以 访问 它 的 根 项 25。 由 于 :的 右 子 树 也 是 空 ， 
所 以 至 此 就 全 部 完成 了 。 


完整 的 清单 是 : | | 
47 31 42 50 25 
中 序 遍 历 的 命名 来 自 于 对 一 种 特殊 的 二 
照 顺序 访问 项 。 例 如 ， 下 面 是 一 个 折 半 查找 树 :“” ， 














50 EF 


中 序 遍 历 将 按 如 下 顺序 访问 项 : 
25 31 42 47 50 


在 一 个 折 半 查找 树 中 ， 左 子 树 中 全 部 的 项 都 小 于 等 于 根 项 ， 而 根 项 又 小 于 等 于 全 部 的 右 
子 树 的 项 。 读 者 认为 折 半 查找 树 还 必须 具备 什么 属性 ， 才 能 使 得 中 序 遍 历 可 以 按 上 顺序 访 问 它 
的 项 ? 


提示 下 面 的 树 不 是 折 半 查找 树 : 
31 


25 47 


50 42 


本 章 剩余 的 大 部 分 和 第 9 章 、 第 10 章 的 全 部 内 容 都 是 讨论 折 半 查找 树 的 。 
遍历 2。 后 序 (postOrder) 遍历 : 左 - 右 - 根 在 二 又 树 : 上 的 算法 是 : 
postOrder(t) 
{ 
If(tdE ss) 
{ | 
postOrder(leftTree(t)); 
postOrder(rightTree(t)): 
访问 t 的 根 项 ; 
yt 
VAG PR ES 


因为 在 每 次 递归 调用 中 访问 一 项 ， 所 以 worstTime(n) 和 n 是 成 线性 关系 的 。 
假设 在 下 面 的 树 中 进行 后 序 遍 历 : 


B 


e 


将 按照 以 下 顺序 访问 项 : 
ABC+* B 
这 个 二 叉 树 可 以 看 作 是 一 个 “表达 式 树 ”: 每 个 非 叶 项 都 是 一 个 二 元 运算 符 ， 它 的 操作 数 
正 古 对 应 的 左 子 树 和 右 子 树 。 根 据 这 个 阐述 可 知 ， 后 序 遍 历 将 得 到 表达 式 的 后 绥 表 示 ! 
W3. WE (preOrder) 遍历: 根 - 左 - 右 在 二 又 树 :上 的 算法 是 : 
preOrder(t) | 
( 
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if(t 非 空 ) 
{ 
访问 t 的 根 项 ; 
preOrder(leftTree(t)); 
preOrder(rightTree(t)); 
Wit 
y/ Ry PR ES 
和 中 序 、 后 序 算法 一 样 ， 它 的 worstTime(n) 也 是 和 nn 成 线性 关系 的 。 


* 


上 图 的 前 序 遍 历 将 按照 如 下 顺序 访问 项 : 
*A+BC 


X —A4 AGASCBDEUL. AIA IEG Bide RAO ay ERR. 
使 用 前 序 记 历 的 二 又 树 搜索 称 作 深度 优先 搜索 ， 因 为 它 总 是 先 从 左边 尽 可 能 地 深入 ， 然 
后 再 搜索 右边 。 例 如 ， 假 设 对 下 面 的 树 进行 深度 优先 搜索 : 


A 


JN. 
A N 
No 


F 


ABR AEA, PATA RIT HE: 
ABDEGIJKH 
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第 4 章 的 回溯 方法 就 包含 了 深度 优先 搜索 ， 但 是 它 的 每 一 步 中 都 可 能 有 多 于 两 个 的 选择 。 
例如 ， 在 迷宫 搜索 中 ， 可 以 选择 向 北 、 东 、 南 和 西 移动 。 因 为 向 北 移动 是 首选 ， 所 以 将 不 断 
重复 这 个 选择 ， 直 到 到 达 目 的 地 或 是 不 能 再 向 北 移动 了 。 然 后 可 能 的 话 将 向 东 移 动 ， 然 后 再 
尽 可 能 向 北 移动 。 在 第 14 章 里 ， 将 在 广义 二 叉 树 中 再 次 遇 到 回调 。 
遍历 4。 广 度 优先 (breadthFirst) 遍历 : HERED ”在 一 个 非 空 二 又 树 t 中 执行 广度 优先 
遍历 ， 首 先 访 问 根 项 ; 接着 自 左 至 右 访问 根 的 子女 ;然后 自 左 至 右 访 问 根 的 孙子 ; 依次 类 推 。 
322 例如 ， 假 设 在 下 面 的 树 中 执行 广度 优先 遍历 : 


A 
D E N, 
x’ l 
I / | 
K 
那么 项 被 访问 的 次 序 是 
ABCDEFGHIJK | 
实现 这 个 遍历 的 一 个 方法 是 逐 层 地 生成 非 空 子 树 (指针 的 ) 链表 。 我 们 需要 检索 符合 产 
生 的 顺序 的 这 些 子 树 ， 这 样 才能 够 逐 层 地 访问 项 。 什 么 样 的 容器 的 检索 顺序 和 插入 顺序 相同 
WE? 是 队列 ! 下 面 是 二 又 树 + 上 的 算法 : 
breadFirst(t) 
人 


Hmy_queue 是 二 叉 树 的 队列 
//tree 是 一 个 二 义 树 


if(t 非 空 ) 

{ 
my queue.push(t); 
while(my_queue 2) 
{ 


tree=my_queue.front(); 
my_queue.pop(); 

访问 tree 的 根 ; 
if(leftTree(t)3E Ss) 
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my queue.push(leftTree(t)); 
if(rightTree(t) 3E Z3) 
my queue.push(rightTree(t)); 
}/while 
H/ 如 果 t 非 空 
M/ 广 度 优先 遍历 


在 每 次 循环 bis *- -个 项 ， 因此 worstTime(n) 和 nn 是 成 线性 关系 的 。 
使 用 队列 进行 广度 优先 遍历 是 因为 需要 按照 它们 保存 的 顺序 检索 这 些 子 树 (SEA, Jet). 


在 中 序 、 后 序 和 前 序 遍 历 里 ， 子 树 按照 和 它们 保存 顺序 相反 的 顺序 检索 (后 人 ， 先 出 )。 这 三 


种 方法 都 使 用 了 递归 ， 正 如 在 第 7 章 中 看 到 的 ， 这 等 价 于 一 个 选 代 的 、 基 于 堆栈 的 算法 。 

在 第 14 章 中 学 习 广 度 优先 遍历 的 数据 结构 时 还 会 遇 到 这 种 遍历 ， 它 的 数据 结构 的 限制 不 
如 二 又 树 那么 严格 。 顺便 提 一 下 ， 如 果 和 希望 更 严格 ， 像 一 个 完全 二 叉 树 ， 那 么 可 以 将 树 存 储 
在 一 个 数组 里 ， 而 广度 优先 遍历 只 不 过 是 迭代 地 通过 数组 。 根 在 素 引 0， 根 的 左 子 女 在 索引 1 
根 的 右 子女 在 索引 2， 根 的 最 左面 的 孙子 在 索引 3， 依 次 类 推 。 

在 完成 二 又 树 的 全 部 理论 介绍 之 后 ， 读 者 可 能 已 经 淮 备 好 学 习 一 个 现实 的 类 了 ， 在 8.2 布 
中 开发 了 BinSearchTree 类 ， 从 用 户 的 角度 来 看 ， 它 首 先是 一 个 数据 结构 。 在 BinSearchTree 里 
插入 和 删除 的 averageTime(n) 和 nn 是 成 对 数 关系 的 。 这 对 插入 和 删除 的 averageTime(n) 和 成 线 
性 关系 的 有 序 向 量 、 双 端 队列 和 链表 而 言 是 一 个 显著 的 改进 。 但 是 在 最 坏 情 况 下 ， 
BinSearchTree 并 不 比 顺 序 容器 类 强 : BinSearchTree 中 的 插入 和 删除 的 worstTime(n) 和 nn 是 成 线 
性 关系 的 。 — 

各 果 想 找 到 插入 和 删除 的 worstTime(n) 和 是 成 对 数 关系 的 类， 那 就 必须 等 到 第 9 章 学 习 了 
AVL 树 之 后 。AVLTree 类 和 第 10 章 的 rb_tree ( 红 黑 树 ) 的 插入 和 删除 在 最 坏 情 况 下 的 时 间 花 费 
古 对 数 关 系 的 。 但 是 它们 的 方法 定义 一 例如 惠普 的 rb_ tree 类 的 实现 一 一 比 折 半 查找 树 的 要 复 
杂 许 多 。 从 实际 角度 来 说 ， BinSearchTree 类 的 主要 目的 是 为 学 习 AVLTree 和 rb tree 类 做 
准备 。 


8.2 折 半 查找 树 
另 一 个 递归 定义 。 | 
先 从 折 半 查找 树 的 递归 定义 开始 : 


nn CRURIAS Ban 
1) leftTree(p) 中 的 每 一 项 都 小 于 等 于 的 根 项 。 


”2) rightTree(D) 中 的 每 一 项 都 大 于 等 于 1 的 根 项 。 
3) leftTree(t) 和 rightTree(1) 剖 是 折 半 查找 树 。 





图 8-6 显 示 了 一 个 折 半 查找 树 。 
eg EEE. 例如 ， 对 图 8-6 中 的 折 半 查找 树 ， 中 序 PAD V; 
问 的 次 序 是 


15 25 28 30 32 36 37 50 55 59 61 68 75 
正如 在 折 半 查找 树 中 曾经 定义 过 的 ， 树 中 是 允许 重复 项 和 的。 有 些 作者 在 折 半 查找 树 的 定 


3 


2 


4 
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义 中 使 用 了 “小 于 ”和 “大 于 。 为 了 和 随后 的 第 10 章 保持 一 致 ， 本 书 选 用 了 “小 于 等 于 和 
大 于 等 于 。 
50 


Yo "A 
/\ LN 
A N N 


36 \ 
图 8-6 一 个 折 半 查找 树 


折 半 查找 树 是 关联 容器 的 一 个 范例 。 在 一 个 关联 容器 中 ， 项 通过 和 其 他 项 的 比较 确定 它 
在 容器 中 的 位 置 。 每 个 项 有 一 个 键 : 它 是 项 的 一 部 分 ， 用 来 进行 比较 。 在 第 9 章 和 第 10 章 中 将 
学 习 其 他 几 个 关联 容器 。 

8.2.1 市 从 BinSearchTree 类 的 用 户 角 度 描述 了 折 半 查找 树 的 数据 结构 。 


8.2.1 BinSearchTree 类 


下 面 通过 BinSearchTree 类 的 方法 接口 学 习 折 半 查找 树 的 数据 结构 。 对 BinSearchTree 类 ， 
假设 每 个 用 户 将 提供 一 个 项 的 类 T 的 实例 化 版 本 ， 以 及 用 operator< 来 比较 项 。 在 和 T 对 应 的 
模板 变 元 中 无 需 显 式 地 定义 operator==， 因 为 a==b 就 等 价 于 !(a<b)&&!(b<a)。 

对 应 于 模板 参数 T 的 项 的 类 必须 定义 operator< 来 比较 项 ， 

现在 用 BinSearchTree 类 来 简单 地 介绍 一 下 折 半 查找 树 。 对 反复 运行 的 程序 ， 成 品 工作 建 
议 采 用 标准 模板 库 的 关联 容器 (参阅 第 10 章 )。 因 此 ， 为 BinSearchTree 类 赋予 大 量 的 方法 还 不 
如 采用 相反 的 途径 。 下 面 是 最 小 的 折 半 查找 树 类 中 的 8 个 方法 接口 (为 了 进行 验证 ， 实 验 20 中 
添加 了 一 个 height 方 法 ): 

1. /后 置 条 件 : 这 个 inSearchTree 为 空 

BinSearchTree(); 

2. // 后 置 条 件 : 返回 这 个 BinSearchTree 中 项 的 数量 . 

unsigned size() const; 


3. /后 置 条 件 : 如 果 在 BinSearchTree 中 有 一 个 项 等 于 item， 那 么 返回 的 
Hf 将 是 指向 该 项 的 迭代 器 。 否 则 ， 返 回 值 将 是 和 end() 方 法 返回 值 相同 的 迭代 器 ， 
II averageTime(n) 是 O(logn)，worstTime(n) 是 O(n)。 








Iterator find (const T& item) const; 


注意 这 是 BinSearchTree 类 中 的 一 个 方法 ， 而 不 是 通用 型 算法 find,， 后 者 的 
averageTime(n) 是 O(n) 而 不 是 O(log n), l 
4. /后 置 条 件 : 将 item 插 入 这 个 BinSearchTree。 返 回 位 于 新 插入 项 上 的 迭代 器 ， 

// average Time(n) #O(logn), worstTime(n)j&O(n), 

Iterator insert (const T& item); 


注意 1 没有 参数 指定 从 哪里 插入 项 。 这 是 因为 必须 根据 顺序 将 项 插入 到 属于 它 的 位 
置 上 。 如 果 允 许 用 户 指定 项 插入 的 位 置 ， 那么 这 个 插入 将 破坏 顺序 ,也 就 不 再 是 一 
个 折 半 查找 树 了 。 


iEX2 ”用户 可 以 排除 在 折 半 查找 树 中 插入 重复 项 的 情况 。 假 设 dictionary 是 
BinsearchTIree 类 的 一 个 对 象 ， 那 么 只 有 当 item 不 在 dictionary 中 时 才 将 其 插入 : 
if (dictionary.find(item)==dictionary.end()) 
dictionary.insert(item); 
5. // 前 置 条 件 : itf 位 于 这 个 BinSearchTree 的 某 一 项 上 ， 
// 后 置 条 件 : 从 BinSearchTree 中 删除 itr 位 置 上 的 项 。 本 次 调用 前 *itr 之 后 的 
/l 所 有 的 迭代 器 将 失效 。worstTime(n) 是 O(n)， amoritizedTime(n) 是 常数 ， 


// 此 averageTime(m) 是 常数 
void erase(iterator itr); 


注意 为 了 在 折 半 查找 树 中 删除 任意 一 项 ， 考虑 结合 find 和 erase 方 法 。 例 如 ， 为 了 从 
BinSearchTreex} £ dictionary P Jf word4y— AK R: 


dictionary.erase(dictionary.find(word)); 


可 以 使 用 循环 在 BinSearchTree 对 象 中 删除 某 一 项 的 全 部 拷贝 。 
6. /后 置 条 件 : 如 果 这 个 BinSearchTree 非 空 ， 那么 将 返回 树 中 位 于 最 小 的 项 上 的 


II DARE. BR, Hi Mend() A+R SAR, 
Iterator begin(); 


7. Hl ORC TIE: EE ELE — 4-5] DUSCHE BinSearch Tree TERHERE. 
// 如 果 这 个 BinSearchTree 非 空 ， 那 么 在 返回 的 和 迭代 器 的 前 一 个 位 置 上 就 是 最 大 
I 的 项 。 


Iterator end(); 
8. // 后 置 条 件 : 释放 为 这 个 BinSearchTree 分 配 的 空间 。 worstTime(n)#O(n), 
~BinSearchTree(); | 
这 些 方法 接口 中 缺少 了 什么 ? Pre Be aR Ba FARAD: push. back, 
pop_back, ，pPush_front 和 pop_front 方 法 。 推 人 操作 在 这 里 是 不 合法 的 ， 因 为 就 像 在 insert 方 法 
(方法 4) 的 “注意 1” 中 所 解释 的 ， 不 允许 用 户 指定 项 播 入 的 位 置 。 弹出 是 合法 的 ， 但 是 这 里 
没有 包含 它们 ， 因为 用 户 很 少 会 希望 删除 最 小 或 最 大 的 项 ， 除非 知道 这 个 项 上 将 发 生 什么 。 而 
在 这 些 情况 中 可 以 使 用 erase 方 法 ; 在 指定 Iterator 类 的 方法 接口 之 后 将 说 明 如 何 完成 这 项 工作 ， 


8.2.2 BinSearchTree 类 的 lterator 类 


折 半 查找 树 的 迭代 器 是 双向 的 ， 因此 这 个 迭代 器 的 方法 和 list 类 的 迭代 器 方法 是 相同 的 : 


UJ 
QN 
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++ 和 - -W BTR. RE, * ( 脱 引 用 )，== 以 及 ! =。 因 此 如 果 itr 是 一 个 Iterator 对 象 ， 那 么 
可 以 采用 下 面 的 循环 友 代 通过 一 个 BinSearchTree 对 象 my_tree: 


for(itr=my_tree.begin();itr!=my_tree.end() ;itr++) 
*itr...W 访 问 itr 位 置 上 的 项 
和 预期 的 相同 ，BinSearchTree 送 代 占 的 增 量 或 减 量 代码 比 回 量 、 链 表 巷 至 是 双 端 队列 的 
A(R RE SLRS 
这 里 用 一 个 小 程序 说 明 BinSearchTree 类 和 它 的 关联 Iterator 类 的 使 用 : 


#include <string> 
#include <iostream> 
#include "bst.h" // Œ Y, BinSearchTree2é 


/ 这 个 程序 验证 一 个 折 半 查找 树 中 的 查找 、 插 入 和 删除 。 


// search tree. 
using namespace std; 


int main ( ) 
{ 
const string CLOSE_WINDOW_PROMPT = 
"Please press the Enter key to close this output window."; 


BinSearchTree<int> tree; 
BinSearchTree « int :Iterator itr; 


tree.insert (85); 
tree.insert (70); 
tree.insert (91); 
tree.insert (70); 


cout << "Here is the tree:" << endi; 
for (itr = tree.begin( ); itr !— tree.end( ); itr++) 
cout << "itr << " ": 


if (tree.find (72) == tree.end( )) 
cout << endl << endl << "72 was not found in the tree" 
<< endi; 


itr = tree.find (85); 
if (itr !— tree.end( )) 
cout << endl << endl << "85 was found in the tree" << endl: 

tree.erase (itr); 
cout << endl << endl << "Here is the tree after 85 was deleted:" 

<< end; | | 
for (itr = tree.begin( ); itr |= tree end( y; itr+ 4) 

cout ««"irr«c*"*- 


cout << endl << endi << "The largest item i in the tree is " 
<< *— —tree.end( ); 


cout << endl << endi << "size = " << tree.size ( ); 


cout << end! << end! << CLOSE_WINDOW_PROMPT: 











cin.get( ); ? 
} // binsearchtreeexample 


输出 如 下 : 


Here is the tree: 
70 70 85 91 


72 Was not found in the tree 
85 was found in the tree 


Here is the tree after 85 was deleted: 
70 70 91 
The largest item in the tree is 91 
size = 3 
Please press the Enter key to close this output window. 
| 注意 树 中 最 大 的 项 是 如 何 被 访问 的 : «Al Atree.end)3k A S 6 Be CX Ze ERU CE , 
所 以 --tree.end() 将 返回 一 个 位 于 最 大 项 位 置 上 的 迭代 器 。 那 么 如 何 访问 树 中 的 最 小 项 呢 ? 
现在 将 注意 力 转 去 关注 BinSearchTree 类 的 一 种 可 能 的 实现 。 编 程 项 目 8.1 探 讨 了 另 一 种 
实现 。 
8.2.3 ”BinSearchTree 类 的 字段 和 实现 


BinSearchTree 类 中 的 字段 和 第 6 章 中 list 关 的 字段 很 相似 。 主要 的 字段 是 header， 是 指 问 
tree’ node 结 构 的 指针 : | 


struct tree node 
i 


Titem; ， E o 

. tree_node* parent, 04 ^ 
lef, | . 
* fight; 


. béol'isHeader: // 人 上 是 不 是 | 
y n iree node — TC ob 


/' tree node*header ` gy 
| BinSearchTree 类 中 惟一 不 间 的 字段 是 : 
unsigned node. count; 


| node “count: Bask T BH Joh. 3300 — itt, node. count 的 值 为 0， 而 在 header 的 


tree_node 中 ，parent 链 接 值 为 NULL， left 和 right 链 接 指 回 header， 并 且 isHeader 值 为 true。 
item 字 段 是 未 定义 的 ; 实际 上 ，header 的 tree_node 的 item 字 段 将 始终 保持 未 定义 状态 ， 就 像 
list 类 的 data 字 段 一 样 。 图 8-7 显示 了 一 个 空 BinSearchTree 对 象 的 配置 。. 

当 向 一 个 空 树 中 添加 项 时 ， 该 项 的 值 被 拷 册 到 根 节点 的 item 字 段 中 根 节点 的 parent 字 自 
将 指 回 header 节 所 ， 而 根 节 点 的 left 和 right 字 段 值 为 NULL。header 中 所 少 的 指针 字段 现在 都 指 


o 
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I] 3X TART RR isHeader-E EHE HAVEL 47 header f RARUS AL 例如 ， 在 将 项 17 揪 入 一 个 空 
树 之 后 ， 得 到 如 图 8-8 所 示 的 树 。 


header 









isHeader 
item 
node_count 


图 8-7 一 个 空 BinSearchTree 对 象 的 表示 
header 





node_count 


parent 
left 
right 





图 8-8 包含 一 个 项 (17) 的 BinSearchTree 对 象 的 内 部 表示 


注意 这 种 表示 法 的 一 个 奇怪 的 特点 : 根 节点 的 父亲 是 头 节 点 ， 而 头 节 点 的 父亲 是 根 节 
A! 因此 根 节 点 是 它 自身 的 祖父 节点 。 BH EUR IET HESSE E "I'm My Own Grandpa” 9, 

在 头 节点 中 ，left 和 right 字 段 分 别 指向 树 中 最 小 和 最 大 的 项 。 | 

当 项 被 添加 进 这 个 树 中 时 , 将 像 预 期 的 那样 调整 根 节点 的 left 和 right 字 段 。header 引 用 的 
攻 避 的 left 和 right 字 段 也 进行 了 调整 ， 这 可 能 是 出 平 意料 的 。 它 们 指向 的 节点 分 别 包含 最 小 和 
最 大 的 项 。 例 如 ， 图 8-9 显 示 了 包含 5 个 项 的 BinSearchTree 对 象 的 内 部 表示 。 

令 header 的 left 字 段 指向 最 小 的 项 ， 这 可 以 使 begin() 方 法 的 设计 变 得 快速 简洁 : 直接 返回 
位 于 header 的 left 字 段 指 向 的 节点 上 的 迭代 器 。 那 么 最 大 项 怎么 办 ? end() 方 法 返回 位 于 
header 的 节点 (也 就 是 最 后 一 个 节点 之 后 的 位 置 ) HA. 因此 用 户 可 以 像 8.2.2 节 中 的 
程序 一 样 ， 从 末尾 退出 之 后 访问 BinSearchTree 的 最 大 项 。 结 采 是 访问 header 的 right 字 段 指向 
的 项 。 | 

在 完成 BinSearchTree 类 之 后 将 实现 Iterator 类 ， 但 是 现在 所 有 需要 了 解 的 有 关 Iterator 的 字 
7 段 和 实现 ， 束 是 它 应 该 有 指针 字段 和 一 个 参数 的 构造 器 : | 


typedef tree node* Link; 


O Mi — RARI AOLDISIEEWEENE. DAMME EEN T — RES. IERSMUBMISSUB (HA 
它们 有 相同 的 父亲 )， 同 时 也 是 M 的 “孙子 ”( 因为 M 的 妻子 是 5 的 祖母 )。 但 是 5 的 “祖父 ”也 是 5 的 兄弟 的 
祖父 ， 因 此 M 是 他 自己 的 祖父 。 | | 





protected: 
Link link; 
Iterator(Link new_link):link(new_link){} 


isHeader header 


item | — 


parent node count 
5 





m 图 8-9 包含 5 个 项 的 BinSearchTree 对 象 的 内 部 表示 


回忆 一 下 、list 类 的 关联 iterator 类 也 有 相似 的 指针 字段 和 一 个 参数 的 构造 器 ， 并 且 它 们 也 
都 是 protected 的 。 | 

接 下 来 看 BinSearchTree 类 的 三 个 基本 方法 一 一 find、insert 和 erase 一 一 的 定义 。 对 find 方 法 ， 
从 一 个 指向 根 的 child 开 始 在 树 中 下 降 ， 根 据 child->item 和 所 搜索 项 的 比较 来 决定 用 child 的 左 
子女 还 是 右 子 女 替 换 child。 方 法 定义 是 : 





lterator find( const T& item) 
{ 
Link parent = header; 
Link child = header -> parent: 
while (child !- NULL) 
{ | 
If (! (child -> item < item) ) 
| 
parent = child; 
child = child -> left; 


- 
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}// if < 
else 
child = child -> right; 

} // while 

if (parent == header || item < parent -> item) 
return end( ); 

eise 
return parent; 

) // find 


例如 ， 假 设 从 下 面 的 折 半 查找 树 开始 : 


58 


37 75 


25 


如 采 在 这 个 树 中 查找 30， 可 以 得 到 下 面 的 parent 和 child 的 值 序列 〈 当 指针 非 空 时 就 给 出 它 
脱 引 用 的 项 ): 


NULL 58 

58 37 

37 25 
NULL 


现在 循环 终止 ， 因 为 child 的 值 为 NULL 。 并 且 由 于 item 小 于 parent->item， 所 以 返回 值 是 
位 于 树 中 最 后 一 项 之 后 的 迭代 器 。 

这 个 方法 的 一 个 与 众 不 同 的 特点 是 它 并 非 访问 了 树 中 搜索 的 项 就 停止 ! (这 和 实验 11 中 
binary_search 算 法 很 相似 。) 假设 ， 比 如 说 在 树 中 搜索 37， 那 么 将 得 到 下 面 的 parent 和 child 的 
值 序列 (指针 非 空 时 就 脱 引 用 ): 





parent child 

NULL 58- 

58 37 

37 25 
NULL 


在 第 二 次 循环 迭代 中 ，child->item 等 于 搜索 的 项 ， 即 37。 那 么 将 child 保 存在 parent 中 并 用 
child->left 蔡 换 child。 从 这 往 后 ，child 项 将 不 再 大 于 搜索 的 项 。 也 就 是 说 ， 从 那 时 起 的 child 项 
将 小 于 等 于 搜索 的 项 。 在 循环 结束 时 ， parent 不 等 于 header， 而 且 item 不 小 于 parent->item， 因 
此 将 返回 parent (位 于 parent 的 迭代 器 ). 为 什么 在 这 个 循环 的 设计 中 找到 项 了 也 不 能 停止 呢 ? 
这 是 出 于 效率 的 考虑 : 每 次 循环 迭代 只 进行 一 次 而 不 是 两 次 比较 。 

这 个 方法 将 花费 多 长 时 间 ? 对 这 个 方法 ， 实 际 是 BinSearchTree 类 的 所 有 不 容易 的 方法 ， 
信 算 worstTime(n) 或 averageTime(n) 的 基本 要 素 是 树 的 高 度 。 假 设 搜索 成 功 (搜索 失败 的 情况 
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也 可 以 采用 相似 的 分 析 )， 最 坏 情 况 下 是 在 一 个 链 上 寻找 树叶 。 例 如 ， 假 设 在 下 面 的 折 半 查找 
树 上 寻找 25: 


50 


25 


在 这 种 情况 中 ， 循 环 迭 代 的 次 数 就 等 于 树 的 高 度 。 一 般 来 说 ， 如 有 果树 中 项 的 数量 是 上 ， 树 
的 高 度 是 n~1， 那 么 worstTime(n) 就 是 和 n 成 线性 关系 的 。 

现在 求 一 个 成 功 查 找 的 averageTime(n)。 关键 仍然 是 树 的 高 度 。 对 通过 随机 插入 和 删除 构 
造 的 折 半 查找 树 而 言 ， 平 均 高 度 H 是 和 n 成 对 数 关系 的 (参见 Cormen，1992)。 实 验 20 里 测试 
了 这 个 结论 。find 方 法 先 在 树 的 第 0 层 搜索 ， 而 且 每 次 循环 迭代 都 下 降 至 树 中 的 下 一 层 。 关 为 
averageTime(n) 需 要 不 超过 五 次 选 代 ， 所 以 马上 可 以 得 出 结论 : averageTime(n)# O(log n). 

为 了 证 实 averageTime(n) 和 nn 成 对 数 关 系 ， 需 要 说 明 O(log n) 是 averageTime(n) 的 最 小 上 界 。 
所 有 折 半 查找 树 的 平均 迭代 次 数 是 大 于 等 于 一 个 完全 折 半 查找 树 的 平均 迭代 次 数 的 。 在 一 个 
完全 二 叉 树 上 中 ， 至 少 有 一 半 的 项 是 树叶 (见习 题 8.13)。 因此 find() 方 法 的 平均 迭代 次 数 必 定 
至 少 是 (height(0- 1D)/2 ， 即 (ceii(log:(z(D+1))-2)2， 见 习题 8.7。 也 就 是 说 find 方 法 的 平均 迭代 
次 数 大 于 等 于 logn 的 某 一 函数 。 因 此 averageTime(n) 不 可 能 再 比 O(logn) 好 了 。 

对 BinSearchTree 类 中 的 find 方 法 ， average Time(n) X fen mH RK RH, 

38 5: BT PN Bt FY LAM 2 averageTime(n) 2 fün X BK RN 顺带 说 一 下 ， 这 就 是 之 所 以 定 
义 find 方 法 而 不 使 用 通用 型 算法 find 的 原因 。 后 者 的 averageTime(n) 是 和 n 成 线性 关系 的 ，。 

如 果 折 半 查 找 树 是 满 的 ， 那 么 树 的 高 度 就 和 "成 对 数 关系 。 正 是 由 于 这 种 情况 折 半 查抄 树 

才 得 以 命名 。 六 时 应 用 find 方 法 和 在 数组 中 应 用 binary_search 通 用 型 算法 访问 的 就 是 相同 顺序 
的 相同 项 。 例 如 ， 满 树 中 的 根 项 对 应 着 数组 中 间 的 项 。 i 


8.24 MAHE ass 


find 方 法 定义 的 一 个 新 奇 之 处 在 于 它 不 是 递归 的 。 本 章 之 前 的 大 部 分 概念 (包括 折 半 查找 
树 自身 ) 都 是 递归 定义 的 。 但 是 当 它 成 为 方法 定义 时 ， 毫 无 例外 的 都 需要 循环 。 为 什么 这 样 
We? 一 人 站 征管 证 ef 和 night 者 是 tee node* 类 型 ， 而 不 是 BinSearchTree 类 型 的 ， 因此 不 
能 调用 


left.find(item)//^R & ik (rS 
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但 是 可 以 使 用 一 个 递归 的 findItem 方 法 ， 使 fnd 成 为 它 的 一 个 包装 方法 : 


bool find (const T& item) 
{ 


return findltem (header -> parent, item); 


M/ 方法 find 
findIltem 方 法 是 相当 简单 的 : 


lterator findltem (Link link, const T& item) 
{ 
if (link == NULL) 
return end( ); 
if (link -> item < item) 
return finditem (link -> right, item); 
if (item < link -> item) 
return findltem (link -> left, item); 
return link; // 自动 类 型 转换 成 lterator 


不 论 在 时 间 还 是 存储 土 ， 这 个 递归 版 本 的 效率 比 迭 代 版 本 都 要 稍微 差 一 些 (尽管 大 O 时 间 
估算 是 相同 的 )。 下 古 这 个 差别 降低 了 这 个 递归 版 本 的 价值 。 迭 代 版 本 实际 上 和 即将 在 第 10 章 
中 看 到 的 rb_tree 类 的 惠普 的 实现 中 的 方法 是 相同 的 ， 它 在 优雅 的 基础 上 实现 了 高 效率 。 另 外 ， 
对 包装 方法 的 需要 也 减少 了 递归 的 一 些 光 彩 。 


insert 方 法 和 find 方 法 很 相似 ， 因为 都 使 用 循环 在 树 中 下 降 并 保存 调整 过 的 节点 指针 的 父 
亲 。 当 插 入 项 成 为 树 最 左边 或 最 右边 项 时 要 特别 小 心 ， 下 面 是 它 的 定义 : 


Herator insert (const T& item) 

( | s 

If (header -> parent == NULL) 
insertLeaf (item, header, header -> parent); 
header -> left = header -> parent; 

. header -> right = header -> parent; 

return header -> parent; 

} / 在 树 的 根 处 插入 

else .: EN 

{ mM E 

Link parent — header, 
child = header -> parent; 


while (child != NULL) 
t | 
parent — child: 
If (item < child -> item) - 
child = child -> teft: 
else 
child — child - right; 





) // while 
if (item < parent -> item) 


{ 


insertLeaf (item, parent, parent -> left); 


if (Reader -> left == parent) // parent -> item 是 最 小 
/ 的 项 
header -> left = parent -> left; 
return parent -> left; 
JH 在 父亲 的 左边 插入 
else 
{ 
insertLeaf (item, parent, parent -> right); 
if (header -> right == parent) // parent -> item 是 最 大 
/ 的 项 | 
header -> right = parent - right; 
return parent -> right; — ' 
) // 在 父亲 的 右边 插入 
) // 树 非 空 
) // insert 


insert 方 法 将 一 项 作为 树叶 插入 到 BinSearchTree 对 象 中 。 | E 
insertLeaf 方 法 实际 上 是 将 项 作为 树叶 插入 ， 调整 链接 并 令 node_count 加 1 : 


void insertLeaf (const T& item, Link parent, Link& child) 
{ 
child = new tree node; 
child -> item = item; 
child -> parent = parent; 
child -> left = NULL; 
child -> right = NULL; 
child -> isHeader = false; 
node_count+ +; EE s 
) // insertLeaf BEES | IE LU 


例如 ， 假 设 在 下 面 的 折 半 查找 树 中 插入 30: 
(5d re 


7 


将 得 到 下 列 parent 和 child 的 值 序列 《指针 非 空 时 就 脱 引用 ): 
parent child 

NULL 58 

58 37 


37 25 
25 NULL 
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现在 while 语 名 的 执行 结束 ， 因 为 child 值 为 NULL。 然 后 ，30>=parent->item， 所 以 30 将 
作为 一 个 树叶 插入 到 parent 的 右边 。 实 际 上 ， 折 半 查 找 树 中 插入 的 每 一 项 都 成 为 一 个 树叶 。 

insert 的 分 析 和 find 的 相同 : averageTime(n) 和 成 对 数 关系 ， 但 是 worstTime(n) 和 n 成 线性 
AAR insertHy BARA LEIA TRA ZEAE (也 稍微 慢 些 )。 就 像 处 理 递 归 find 方 法 一 样 ， 还 
是 从 一 个 包装 方法 开始 : 


. Iterator insert (const T& item) 


{ 
If (header -> parent == NULL) 


{ 
insertLeaf (item, header, header -> parent); 
header -> left = header -> parent; 
header -> right = header -> parent; 
return header -> parent; 
) // 在 树 的 根 处 插入 
return insertitem (item, header, header -> parent); 
} // insert 
递归 方法 insertItem 如 下 : 


Iterator insertitem (const T& item, Link parent, Link& child) 
{ 
if (child == NULL) 
{ 
insertLeaf (item, parent, child); 
if (item < header -> left -> item) 
header -> left = child; 
if (item > header -> right -> item) 
header -> right = child; 
return child; 
} 
if (item < child -> item) 
return insertitem (item, child, child -> left); 
return insertitem (item, child, child -> right); 
) // 方法 inserttem 


现在 处 理 erase(Iterator itr) 方 法 。 给 出 Iterator 参 数 itr， 需要 访问 指向 itr 节 点 的 itr 父 节点 中 
的 字段 。 如 果 itr 位 于 根 节 点 ， 那么 这 就 是 parent 字 段 ， 否则 就 是 itr 的 父亲 的 left 或 right 字 段 。 
然后 改变 该 指针 字段 完成 对 itr 节 点 的 删除 。 因 此 实现 删除 的 方法 (deleteLink) 需要 一 个 指针 
作为 引用 参数 。 见 习题 8.15。 | 


前 面 已 经 提 到 过 Iterator 类 有 一 个 指针 字段 link， 它 指向 选 代 器 位 于 的 节点 。 这 是 定义 erase 


方法 时 需要 知道 的 对 Iterator 类 的 全 部 。 下 面 是 erase 的 定义 : 


void erase (iterator itr) 
{ 
If (itr.link -> parent -> parent == itr.link) // itr 位 于 根 节点 
deleteLink (itr.link -> parent -> parent); 
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else if (itr.link -> parent -> left == itr.link) // itr 位 于 一 个 左 子女 处 
deleteLink (itr.link -> parent -> left); 
else . 
deleteLink (itr.link -> parent -> right); 
) // erase 
deleteLink 方 法 删除 了 参数 link 指 向 的 节点 。 如 果 该 节点 的 左 子 树 或 右 子 树 为 空 ， 那 么 只 
要 简单 地 将 这 个 市 点 草 除 掉 即 可 。 也 就 是 说 ， 用 它 的 右 子 树 的 节点 替换 它 (如 果 左 子 树 为 空 ) 
或 者 用 它 的 左 子 树 的 节点 替换 它 。 图 8-10 显 示 了 这 个 删除 示例 发 生 之 前 和 之 后 的 情况 。 如 果 
两 个 子 树 都 非 空 时 删除 要 困难 一 些 。 举 例 解释 这 种 情况 ， 比 如 要 删除 图 8-11 中 的 树 根 。 
对 有 两 个 子女 的 项 ，erase 方 法 将 用 项 的 直接 后 任 取代 它 ， 然 后 从 树 中 剪除 这 个 后 任 。 
我 们 升 户 在 不 重 构 树 的 情况 下 完成 删除 。 因 此 在 删除 28 之 前 ， 需 要 先 找到 一 项 来 替换 28。 
在 这 一 点 上 惟一 适合 的 项 是 直接 前 任 26 和 直接 后 任 37。 例 如 ， 如 果 在 图 8-11 中 用 37 替 换 28， 
然后 在 树 中 删除 以 “ 旧 ” 的 37 为 根 的 树 的 根 项 ， 将 得 到 如 图 8-12 所 示 的 树 。 由 于 即将 删除 的 
项 的 直接 后 任 是 它 的 右 子 树 中 最 左边 的 项 ， 那 个 项 没有 左 子 女 ， 因 此 该 项 的 删除 就 换 成 了 剪 
除 过 程 ， 参 见 图 8-10。 


30 





a) 


图 8-11 即将 删除 28 的 折 半 查找 树 
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图 8-12 在 图 8-11 中 的 折 半 查找 树 中 删除 28， 用 28 的 直接 后 任 
37 和 替换 28 ， 然 后 删除 “ 旧 ” 的 37 之 后 的 折 半 查找 树 


至 今 还 没有 给 出 deleteLink 方 法 。 prune 方 法 用 link 的 左 子 树 或 右 子 树 中 适当 的 一 个 替换 
link。 查 找 和 删除 右 子 树 中 后 任 的 工作 比较 麻烦 ， 把 这 项 工作 推迟 。 


IRER: 删除 link 指 向 的 项 。 


339 void deleteLink(Link& link)( 
if(link->left==NULLillink->right==NULL)// 项 没有 子女 
prune(link); 
else 
/从 link 的 右 子 树 中 删除 link 的 后 任 。 
V/deleteLink 
prune 方 法 的 定义 是 比较 简单 的 ， 但 被 删除 的 节点 包含 最 小 或 最 大 的 项 时 除外 。 例 如 ， 
设 要 剪除 下 面 树 的 根 : 
50 
80 
70 90 
60 


在 删除 之 前 ，50 是 最 小 的 项 。 为 了 在 删除 后 获得 最 小 的 项 ， 需 要 从 新 的 根 ， 项 80 开 始 尽 
可 能 地 疝 左 移动 ， 直 到 包含 项 60 的 节点 。 然 后 在 header 的 left 字 段 中 存储 指向 这 个 节点 的 指 
针 ; 回想 一 下 ，header 的 left 字 段 总 是 指向 包含 最 小 项 的 节点 。 

下 面 是 prune 方 法 的 定义 : 








=the 267 


/ 前 置 条 件 : link 指 向 的 子 树 至 少 有 一 个 子女 。 
HERR: 从 这 个 BinSearchTree 中 删除 link 指 向 的 项 
// BinSearchTree. 
void prune (Link& link) 
{ 
Link linkCopy = link, 
newLink; 


node_count— —; 
if (link -> left == NULL) && (link -> right == NULL)) 
{ 
if (link == header -> left) 
header -> left = link -> parent; // 新 最 左 项 
if (link == header -> right) 
header -> right = link -> parent; // 新 最 右 项 
link = NULL; 
) // link 的 项 是 树叶 
else if (link -> left == NULL) 
{ 
link = link -> right; 
link -> parent = linkCopy - parent; 
if (linkCopy == header -> left) 
| : 
newLink = link; | 
while ((newLink -> left) !=. NULL) 
newLink = newLink -> left; 
header -> left = newLink; li 新 最 左 项 
} / 重新 计算 最 左 项 
) // link - left 非 空 
else 
{ 
link = link -> left; . 
link -> parent = linkCopy -> parent; 
if (linkCopy == header -> right) 
{ 
newLink = link; 
while ((newLink - right) != NULL) 
newLink = newLink -> right; 
header -> right = newLink; // 新 最 右 项 
} / 重新 计算 最 右 项 
) // root -> right 非 空 
delete linkCopy; 
} // prune 


最 后 ， 开 发 代码 以 在 link 的 右 子 树 中 删除 它 的 后 任 。 — ME TRRRH S 
的 节点 。 当 最 后 到 达 一 一 个 左 子 树 为 空 的 节点 ， 那么 节点 中 的 项 就 是 被 删除 项 的 后 任 。 然后 用 
link 的 后 后 任 项 替换 link 的 项 ， 再 从 柄 中 前 除 那个 后 任 节点 。 

下 面 是 deleteLink 的 定义 : 
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/ 后 置 条 件 : 删除 原先 在 link 中 的 项 。 
void deleteLink (Link& link) 


{ 
if (link -> left == NULL || link -> right == NULL) 


prune (link); 
eise if (link -> right -> left == NULL) 
{ 
link -> item = link -> right -> item; 
prune (link -> right); 
) / link 的 右 子 树 的 空 左 子 树 
else 
{ 
Link temp = link -> right -> left; 
while (temp -> left != NULL) 
temp = temp -> left; 
link -> item = temp -> item; 
prune (temp -> parent -> left); 


}W link 的 右 子 树 的 非 空 左 子 树 
) // deleteLink 


现在 开始 分 析 最 坏 情 况 下 的 erase 方 法 和 它 的 附属 方法 : Iterator 位 于 树 根 ， 并 且 树 是 一 个 
链 ， 链 的 惟一 的 树叶 是 根 项 的 后 任 。 那 么 deleteLink 中 循环 迭代 的 次 数 将 是 n-1。 因 此 
worstIime(z2) 和 z 成 线性 关系 。 平 均 情况 下 ， 查 找 后 任 的 循环 迭代 次 数 就 等 于 Iterator 类 中 
Operator++ 的 迭代 次 数 。 在 8.2.5 节 中 将 证 明 operator++ 的 averageTime(n) 是 常数 ; 实际 上 
amortizedTime(n) 也 是 常数 。 因 此 erase 方 法 和 的 averageTime(n) 是 常数 。 

最 后 开发 析 构 器 。 使 用 包装 器 ， 递 归 版 本 是 小 巧 易 用 的 。 包 装 器 调用 的 destroy 方 法 递归 © 
地 消除 节点 的 左 子 树 和 右 子 树 ， 然 后 释放 节点 的 空间 : — 


~BinSearchTree( ) 


{ 


destroy (header -> parent); 


} // 析 构 器 


void destroy (Link link) 
{ 
if (link != NULL) 
{ 
destroy (link -> left); 
destroy (link -> right); 
delete (link); 
) / if E 
) // destroy 方法 


在 每 一 对 递归 调用 中 释放 一 个 节点 ， 因 此 总 的 递归 调用 次 数 是 2n，、 且 worstTime(n) 和 n 成 
线性 关系 。 析 构 器 的 迭代 版 本 有 点 笨拙 ， 因 为 一 旦 节点 被 释放 ， 那 么 它 的 父亲 就 不 再 能 访问 
到 了 。 开 发 迭代 版 本 的 提示 参阅 习题 3.8。 
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8.2.5 BinSearchTreejx RE 


在 结束 对 折 半 查找 树 的 讨论 之 前 ， 需 要 对 关联 Iterator 类 的 设计 说 几 句 。 正 如 前 面 看 到 的 ， 
Iterator 类 只 有 一 个 字段 link， 它 指向 某 一 节点 ， 以 及 通过 一 个 节点 指针 创建 迭代 器 的 构造 器 。 

脱 引 用 运算 符 ( 即 operator*) 及 operator== 都 用 一 行 定 义 。 但 是 ++ 和 一 的 定义 就 不 
太 直 接 了 。 解 释 一 下 原因 ， 假 设 有 一 个 迭代 器 位 于 下 面 的 树 中 项 50 所 在 的 节点 ， 如 何 增加 
itr 呢 ? 


50 的 后 任 是 55。 为 了 从 50 到 达 这 个 后 任 ， 先 向 右 移动 (到 75) ， 然 后 尽 可 能 地 向 左 移动 。 
总 是 可 以 这 样 进 行 吗 ? 只 有 对 那些 有 非 空 右 子 女 的 节点 才 是 这 样 。 iR neat (比如 
包含 项 36 的 节点 ) 会 怎样 呢 ? 如 果 一 个 节点 link 的 右 子 女 为 NULL， 就 在 树 中 向 上 移动 ， 尽 可 
能 地 同 左 找到 后 任 ; link 的 后 任 是 link 的 最 左边 的 祖先 的 父亲 。 例 如 ，36 的 后 任 是 37。 相 似 地 ， 
68 的 后 任 是 75。 同 理 ，28 的 后 任 是 30; 因为 28 是 一 个 左 子 女 ， 所 以 向 上 向 左 0 次 一 一 仍然 在 28， 
然后 得 到 该 节点 的 父亲 ， 它 的 项 是 30。 最 后 ，75 的 后 任 是 NULL， 因为 它 最 左边 的 祖先 是 50， 
它 是 没有 父亲 的 。 

下 面 是 ++ 的 前 加 版 本 的 定义 : 


Iterator& lterator:operator++ () . 
{ 
Link tempLink; 
Af ((link -> right) 12 NULL) 
4 Sh T 
link = link -> right; 
— while ((lirik -> left} != NULL) | 
| link = link -> teft; | Unt. sus 343 
ul 节点 有 右 子 妇 | mE 
else 
{ 
tempLink = link -> parent; 
while (link == tempLink -> right) 
{ mE 
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link — tempLink; 
tempLink = tempLink -> parent; 
} /向 上 移动 并 尽 可 能 向 左 
if ((link -> right) != tempLink) 
link = tempLink; 
JI 节点 没有 右 子女 
return ‘this: 
}/ Bj 十 十 


operator++() 的 时 间 花 费 不 一 定 是 常数 。 例 如 ， 如 果 将 序列 n,1,2,3,...,n-1 插 入 进 一 个 初 
始 为 空 的 树 ， 那 么 从 nn 一 1 到 将 需要 O(n) 次 迭代 。 因 此 worstTime(n) 是 和 nn 成 线性 关系 的 。 但 是 


在 树 的 过 历 中 ， 每 个 市 点 至 少 被 指向 一 次 ， 至 多 被 指向 三 次 : 一 次 到 达 它 的 左 子 树 ， 一 次 是 


它 目 身 ， 一 次 到 达 它 的 在 子 树 的 后 任 。 那 么 遍历 树 中 的 nm 项 需要 mn 到 3n 之 间 次 迭代 。 这 了 睹 示 着 
A, {LaverageTime(n) ze 2x, mH xtoperator++ () 的 n 次 连续 调用 ，worstTime(n) 也 只 是 和 n 
成 线性 关系 。 换 句 话 说 ，operator++0O) 的 amortizedTime(n) 是 常数 ，。 

惟一 需要 isHeader 字 段 的 地 方 是 减 运算 符 中 ， 它 的 开头 如 下 : 


Iterator& operator——() 


{ 
if (link -> isHeader) 
link = link -> right; // 返回 最 右边 的 


ix AMI) 18 PEE Foil E BinSearchTreezr 28 RH Te. Ael AR HEB 
link==header | 


因为 BinSearchTree 字 段 ， 如 header， 不 能 用 在 Hterator 类 中 ， 除非 该 字段 和 一 个 具体 的 
BinSearchTree 对 象 关 联 (例如 ，myTree.header)。 并 且 也 不 能 将 条 件 换 成 

link->parent->parent==link | n 

BAX A ZR EAR LAE OA. FLESH A Iterator2i A) SEE) BinSearchTree2& ay LJ d [i] A 
书 网 站 的 源 代 码 链接 。 

实验 20 提 供 了 对 前 面 观点 (BinSearchTree 对 象 的 平均 高 度 是 和 "成 对 数 关系 ) 的 运行 时 
支持 。 


实验 20: BinSearchTree 的 平均 高 度 (所 有 实验 都 是 可 选 的 ) 


这 里 没有 包含 任何 BinSearchTree 类 的 应 用 ， 因为 只 要 重新 定义 第 9 章 和 第 10 章 中 的 类 

( AVLTree, tree, set, multiset. mapzkmultimap) 之 一 的 树 实例 就 可 以 到 代 任 何 应 用 。 对 这 

些 类 中 的 每 一 个 ， 即 使 在 最 坏 情 况 下 ， 插 入 、 删 除 和 查找 都 花费 对 数 时 间 ， 而 所 有 其 他 的 方 
法 的 性 能 都 和 BinSearchTree 中 的 相同 。 


总 结 
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一 义 树 ! 要 么 为 空 ， 要 么 由 一 项 称 作 根 项 的 和 两 个 不 相交 的 称 作 : 的 左 子 树 和 右 子 树 的 二 又 








树 组 成 。 这 是 一 个 递归 的 定义 ， 并 且 还 有 很 多 相关 术语 的 递归 定义 : 高 度 ， 树 叶 数 量 ， 项 的 
数量 ， 二 - 树 ， 满 树 ， 等 等 。 这 些 术 语 之 间 的 相互 关系 可 由 正面 的 定理 表示 : 
二 义 树 定理 ”对 任意 非 空 二 又 树 1， 


leaves(t) < < ?) height) 


n(t)+1 
2.0 


当 且 仅 当 1 是 一 个 二 一 树 时 第 一 个 相等 关系 成 立 。 
当 且 仅 当 1 是 一 个 满 树 时 第 二 个 相等 关系 成 立 。 





对 一 个 二 又 树 !。; 的 外 部 路 径 长 度 E(D) 是 从 根 到 树叶 所 有 距离 的 总 和 。 基 于 比较 的 排序 算 
法 的 下 界 可 以 由 下 面 的 定理 获得 : 


外 部 路 径 长 度 定理 令 t 是 有 Kk 个 (Kk>0) 树叶 的 二 又 树 ， 那 么 
E(t) > (kK/2)floor(log,k) 


折 半 查找 树 ! 是 一 个 二 又 树 ， 它 满足 /为 空 ， 或 者 

1) leftTree(D) 中 的 每 一 项 都 小 于 等 于 的 根 项 。 

2) rightTree(1) 中 的 每 一 项 都 大 于 等 于 1 的 根 项 。 

3) leftTree(D 和 rightTree(D 都 是 折 半 查找 树 。 | 

BinSearchTree 类 保存 了 一 个 折 半 查找 树 的 项 。 对 find、insert 和 erase 方 法 ， worstTime(n) 
是 O(n)， 其 中 n 是 树 中 项 的 数量 。 但 是 这 三 个 方法 的 averageTime(n) 都 是 O(logn)，。 


习题 
8.1 解答 有 关 下 面 二 又 树 的 问题 : 


-- 
CA 
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a. 哪 一 个 是 根 项 ? 

b. 树 中 有 多 少 项 ? 

c. 树 中 有 多 少 树 叶 ? 

d. 树 的 高 度 是 多 少 ? 

e. 左 子 树 的 高 度 是 多 少 ? 

f. 右 子 树 的 高 度 是 多 少 ? 

g. 的 层次 是 多 少 ? 

h. C 的 深度 是 多 少 ? 

i.C 有 几 个 子女 ? 

j 的 父亲 是 哪 一 个 ? 

k. B 的 子孙 有 哪些 ? 

|. FF 的 祖先 有 了 哪些? | 

m. £Erb FS Eo ib BBP se HH RT RH A? 

n. 在 后 序 遍 历 过 程 中 输出 项 的 结果 是 什么 ? 

o. 在 前 序 遍 历 过 程 中 输出 项 的 结果 是 什么 ? 

P. 在 广度 优先 遍历 过 程 中 输出 项 的 结果 是 什么 ? 
8.2 a. 构造 一 个 高 度 为 3、 包 含 8 个 项 的 二 叉 树 。 

b. 能 任 构造 一 个 高 度 为 >、 包含 8 个 项 的 二 又 树 ? 

c. 当 n 分 别 到 1 到 20 之 间 的 整数 时 ， 求 n 个 项 的 二 又 树 可 能 的 最 小 高 度 。 

d. 根据 在 c 小 题 的 计算 结果 ， 尝 试用 公式 表示 n 个 项 的 二 又 树 可 能 的 最 小 高 度 ， 其 中 

是 任意 的 正 整 数 。 

e. 令 n 是 任意 正 整数 。 用 归纳 法 验证 4 个 项 的 二 又 树 可 能 的 最 小 高 度 是 floor(log,n)。 
8.3 a. 10 个 项 的 二 叉 树 中 树叶 可 能 的 最 大 数量 是 多 少 ? 构造 一 个 这 样 的 树 。 

b. 10 个 项 的 二 叉 树 中 树叶 可 能 的 最 小 数量 是 多 少 ? 构造 一 个 这 样 的 树 ， 
8.4 a. 构造 一 个 不 是 完全 树 的 二 - 树 。 ” 

b. 构造 一 个 不 是 二 - 树 的 完全 树 。 

c. 构造 一 个 不 满 的 完全 二 - 树 。 

d. 在 包含 17 个 项 的 二 - 树 中 有 多 少 树叶 ? | 

e. 在 包含 731 个 项 的 二 - 树 中 有 多 少 树叶? 

f. 二 - 树 必 须 总 是 包含 奇数 个 项 。 为 什么 ? 
提示 使 用 二 叉 树 定理 以 及 树叶 数量 必须 是 整数 这 一 事实 。 

g. 高 度 为 4 的 满 二 叉 树 中 共有 多 少 项 ? 

h. 高 度 为 12 的 满 二 叉 树 中 共有 多 少 项 ? 

i. 使 用 二 又 树 定理 和 每 个 满 树 都 是 二 -- 树 这 一 事实 ， 求 包含 63 个 项 的 满 二 又 树 的 树叶 

数量 。 


8.5 说 明 在 下 面 的 二 又 树 中 分 别 采用 中 序 、 后 序 、 前 序 和 广度 优先 遍历 时 ， 项 的 访 间 次 
序 。 
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8.6 证 明 一 个 包含 ?个 项 的 二 又 树 有 2m+1 个 子 树 〈 包 括 整 个 树 在 内 )。 这 些 子 树 有 多 少 是 
空 的 ? 
8.7 证 明 : 如 果 ! 是 一 个 完全 二 叉 树 ， 那 么 
height(f)=ceil(log,(n(t}+1))-—1 
ceil 函 数 返 回 大 于 等 于 它 的 变量 的 最 小 的 整数 。 例 如 ，ceil(35.3)=36。 
提示 令 t 是 一 个 完全 二 又 树 ，t1 是 一 个 高 度 比 t 小 1 的 满 二 又 树 。 令 纪 是 一 个 和 1 高 度 相 
同 的 满 二 又 树 。 因 此 n(t1)<n(1) < n(t2)。 因 为 og 加 数 是 严格 递增 的 ， 所 以 : 
log,(n(t1)+1)— 1<log,(n(t)+1)— 1 € log,n(t2)+1)-1 
第 一 个 不 等 式 左边 的 值 是 一 个 整数 ， (HHA? ) 它 比 第 二 个 不 等 式 右边 的 值 小 1。 
(为 什么 ? ) 因此 
| ceil(log,(n(D+1))~1 = log,(n(t2)+1)- 1 
同 理 ， 
log,(n(t2)+1)— 1=height(t2) (为 什么 ? ) 
8.8 二 又 树 定理 是 针对 非 空 二 叉 树 表述 的 。 定理 的 6 个 部 分 中 哪 一 个 对 空 树 是 不 成 立 的 ? 
提示 (0+1)/2.0!=0, | 
8.9 Sth — A ke —- BHBleaves()- (0) 1)/2893E S: — SCBEUST ZR DAL 
8.10 证 明 二 又 树 定理 的 第 3 部 分 。 


提示 对 树 的 高 度 使 用 数学 归纳 法 (通用 形式 )。 


8.11 a. 说 明 将 下 列 项 插入 一 个 初始 为 空 的 BinSearchTree 对 象 后 的 结果 : 
30 40 20 90 10 50 70 60 80 


b. 寻找 插入 后 能 够 和 a 小 题 产生 相同 的 BinSearchTree 对 象 的 另 一 个 项 序列 。 
8.12 用 语言 描述 如 何 从 折 半 查找 树 中 删除 下 面 的 每 个 项 : 348 
a. 没有 子女 的 项 。 
b. 有 一 个 子女 的 项 。 
c. 有 两 个 子女 的 项 。 
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8.13 证 明 在 任意 完全 二 叉 树 ! 中 ， 至 少 有 一 半 的 项 是 树叶 。 

提示 。 如 果 1 为 空 就 没有 项 ， 因 此 结论 显然 为 真 。 如 果 位 于 最 高 索引 的 树叶 是 一 个 右 
子女 ， 那 么 1 是 一 个 二 - 树 ， 结 论 可 以 遵循 二 又 树 定 理 的 第 3 部 分 。 否 则 就 给 ! 增 加 一 个 
左 子 女 ， 使 它 变 成 一 个 有 P(D- 1 个 项 的 完全 二 - 树 。 

8.14 开发 BinSearchTree 类 的 deleteLink 方 法 的 递归 版 本 。 


提示 令 deleteLink 调 用 递归 方法 deleteSuccessor， 它 的 方法 接口 如 下 : 


/后 置 条 件 : 在 这 次 调用 中 后 任 项 被 删除 前 ，successor 中 包含 了 树 的 link 项 的 后 任 项 ， 
void deleteSuccessor(T& successor, Link& link); 


8.15 erase 方 法 体 的 前 两 行 是 : 
itr(itr.link->parent->parent==itr.link)Witr 位 于 根 节点 
deleteLink(itr.link->parent->parent); 
H[ fi itr.link-»parent-»parentgt 2% -Fitr.link , 下 面 的 deleteLink 调 用 
deleteLink(itr.link); 


也 是 不 正确 的 ， 解 释 原因 。 


提示 ”哪个 树 节 点 的 什么 字段 指向 根 节 点 (因此 如 果 根 节点 即将 被 删除 ， 它 也 必须 随 
之 修改 ) ? 


8.16 JF E BinSearchTree2E 85 Jp Kj 38 080 yk Cf As, 

提示 实现 8.1.2 节 中 的 广度 优先 遍历 算法 。 这 里 用 一 个 链接 队列 代替 二 又 树 队 列 ， 先 
向 队列 中 插入 根 ， 也 就 是 header->parent。 当 在 队列 中 删除 每 个 link 时 ， 就 将 它 的 左右 
子 树 的 链接 插入 队列 ， 除 非 这 些 链 接 为 NULL。 最 后 ， 释放 link 指 向 的 节点 空间 。 


编程 项 目 8.1: BinSearchTree 类 的 另 一 种 实现 


这 个 项 目 说 明了 折 半 查找 树 的 数据 结构 有 多 个 实现 。 读者 可 以 使 用 下 面 描 述 的 方法 将 -一 
个 折 半 查找 树 (实际 上 可 以 是 任意 二 叉 树 ) 存 人 磁盘 ， 这 样 以 后 可 以 重新 得 到 它 的 原始 结构 。 

开发 折 半 查找 树 的 数据 结构 的 基于 数组 的 设计 和 实现 。 开 发 的 这 个 类 一 BinSearchTree- 
Array 一 一 和 BinSearchTree 类 有 相同 的 方法 描述 ,但 是 使 用 索引 模拟 了 父亲 、 左 链接 和 右 链 接 ， 
例如 ，tree_node 可 以 声明 如 下 : | | 

struct tree node. 


{ 





T item; 
int parent, 
left, 
right; 
};//tree_node 


加 理 ，BinSearchTreeArray 类 可 能 包含 下 面 的 三 个 字段 : 


—OURB fe tf AF RA 


tree node[] tree; 
int header; 
unsigned nodeCount; 
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头 节 点 存储 在 tree[0] 中 ， 根 节点 存储 在 tree[1] 中 ， 因 此 在 tree_node 里 不 需要 isHeader 字 段 。 


NULL 指 针 用 -1 表示 。 人 例如， 假设 按 顺 序 输入 “dog”` 、 "turtle", * womba-t" 


“ferret” 创 建 一 个 折 半 查找 树 。 那 么 树 的 形式 如 下 : 


dog 


cat turtle 


ferret wombat 


项 将 按照 插入 的 顺序 从 索引 1 开始 存放 进 树 的 数组 。 数 组 的 表示 是 : 





方法 定义 和 BinSearchTree 类 中 的 非常 相近 ， 除 了 如 下 面 形式 的 表达 式 


header->left 


被 替换 成 
tree[HEADER].left//const int HEADER=0; 


例如 ，find 的 方法 可 能 定义 如 下 : 


Herator find (const T& item) 
{ 
int parent = HEADER; / const int HEADER = 0; 
int child = = eaten 
-while (child != ~1) | 
{ 


: Fase [child].item < “o 


parent = = child; 

child = tree [child].left; 
} // item <= tree [child].item 
else 


child = tree [child].right; - 


、: eat’ 和 








; dro o 


T 








第 9 章 AVL 


正如 在 第 8 章 中 提 到 的 ， 折 半 查 找 树 存 在 的 一 个 很 严重 的 问题 是 它们 可 能 会 严重 不 平衡 。 
特别 是 BinSearchTree 类 中 find、insert 和 erase 方 法 的 worstTime( 和 wm 成 线性 关系 。 我 们 项 望 避 
免 这 些 方法 的 worstTime 与 4 的 线性 时 间 花 费 。 大 体 策略 是 保持 树 的 高 度 和 nn 成 对 数 关 系 。 本 章 





ERR. 

在 标准 模板 库 中 并 没有 包括 AVL 树 。 但 是 AVL 树 中 的 插入 和 删除 算法 比 即将 在 第 10 章 中 
学 习 到 的 红 黑 树 的 算法 要 简单 些 。 标 准 模板 库 有 四 个 关联 容器 类 一 set、multiset、map 和 
multimap， 它 们 通常 是 用 红叶 树 实现 的 


目标 


1) 了 解 平衡 的 折 半 查找 树 对 普通 的 折 半 查找 树 有 什么 改进 。 
2) 说 明 AVL 树 是 平衡 的 折 半 查找 树 。 

3) 解释 什么 是 函数 对 象 以 及 如 何 使 用 函数 对 象 。 

4) 能 够 使 用 方法 在 AVL 树 中 插入 。 


9.1 平衡 的 折 半 查找 树 


根据 第 8 章 中 对 find、insert 和 erase 方 法 的 分 析 ， 很 明显 折 半 查找 树 在 平均 情况 下 是 有 效率 
的 ， 但 是 在 最 坏 情况 下 它 是 一 个 链 ， 和 向 量 、 双 端 队列 或 链表 差不多 。 有 几 个 数据 结构 是 基 
于 折 半 查找 树 且 总 是 平衡 的 。 如 果 一 个 折 半 查找 树 的 高 度 总 是 和 树 中 项 的 数量 "成 对 数 关系 ， 
就 称 它 是 平衡 的 。 

三 种 广为人知 的 平衡 折 半 查找 树 的 数据 结构 是 AVL 树 、 红 黑 树 和 扩展 树 。92 寺 中 研究 了 
AVL 树 ， 并 将 在 编程 项 目 9.1 中 做 进一步 的 探讨 。 第 10 章 将 研究 红 黑 树 。 有 关 扩 展 树 的 信息 ， 
有 兴趣 的 读者 可 以 参考 Sahni(2000)。 这 些 数 据 结 构 都 不 是 标准 模板 库 中 的 内 容 。 但 是 在 标准 
模板 库 的 惠普 实现 中 ， 在 定义 标准 模板 库 的 四 个 关联 容器 类 中 的 一 个 private 字 段 时 使 用 了 
rb tree (LER) 类 。 

9.2 节 中 描述 了 如 何 获 得 高 度 与 4 成 对 数 关系 的 折 半 查找 树 。 


9.2 旋转 


保持 一 个 折 半 查找 树 平衡 的 基本 机 制 是 旋转 : 将 树 绕 着 某 一 项 进行 调整 ， 并 保证 项 需要 
的 顺序 。 这 里 将 探究 旋转 中 的 螺母 和 螺钉 ; 在 9.3.4 节 、10.1.3 节 、10.1.4 节 和 编程 项 目 9.1 中 将 
看 到 它们 是 如 何 使 用 的 。 / 
有 两 种 基本 的 旋转 类 型 。 在 左 施 转 中 ， 将 项 移动 到 它 的 左 子女 的 位 置 上 ， 而 将 项 的 右 子 
女 移动 到 它 的 位 置 上 。 例 如 ， 图 9-1 显 示 了 绕 着 项 50 进 行 的 左旋 转 。 在 旋转 之 前 和 之 后 ， 树 都 
是 一 个 折 半 查找 树 。 


G2 
o 
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图 9-2 显 示 了 男 一 个 围绕 项 80 进 行 左旋 转 的 例子 ， 它 将 树 的 高 度 从 3 降低 到 2。 图 9-2 中 一 -个 
有 趣 的 特点 是 ， 旋 转 之 前 90 的 左 子女 85 最 后 成 了 80 的 右 子 女 。 这 是 所 有 围绕 x 进行 的 左旋 转 的 
KARR: x 的 右 子女 的 左 子 树 成 为 x 的 右 子 树 。 在 图 9-1 中 也 发 生 了 相同 的 现象 ， 但 是 50 的 右 
子女 的 左 子 树 为 空 。 | 

图 9-3 将 图 9-2 中 的 旋转 推广 到 一 个 更 广泛 的 情形 : 旋转 所 围绕 的 项 不 是 树 的 根 项 。 图 9-3 
说 明了 所 有 旋转 的 另 一 个 方面 : 所 有 不 在 旋转 项 子 树 中 的 项 是 不 受 旋转 影响 的 。 也 就 是 说 ， 
在 这 两 个 树 中 都 有 : 


50 
LC 
30 
20 40 
50 90 
-m 
90 50 100 
100 


图 9-1 围绕 50 进 行 左旋 转 


VAN | 90 

60 90 80 120 
VAN /\ / 
85 120 | 60 85 100 


| 图 9-2 围绕 80 进 行 左旋 转 
旋转 的 代码 并 不 涉及 任何 项 的 移动 ; 只 征 操 作 指 向 节点 的 指针 。 假设 x 是 指向 一 个 节点 的 
指针 ， y 是 指向 x 的 右 子 女 的 指针 。 围绕 x 的 左旋 转 基 本 可 以 通过 两 个 步骤 实现 : 
x->right=y->left;// 例 如 ， 图 9-2 中 的 85 
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y->left=x; 
30 80 30 90 
20 40 60 AN 20 = 40 入 / 
85 120 | 60 85 1 
100 


图 9-3 围绕 图 9-2 中 的 80 进 行 左旋 转 ， 但 是 这 里 的 80 不 是 根 项 


旋转 的 大 部 分 代码 都 需要 调整 旋转 所 围绕 项 的 父亲 。 
不 位 的 是 也 必须 调整 Parent 字段 并 添加 相当 多 的 代码 。 这 里 是 BinSearchTree 类 中 
rotate_left 方 法 的 完整 定义 一 一 回忆 第 8 章 中 header 节 点 的 parent 字 段 指向 根 节 点 : 


/ 来 自 Cormen (1990) 
l MES ES 执行 围绕 x 的 左旋 转 。 
void rotateLeft (tree_node* x) 
{ 
tree node* y = x -> right; 
x - right — y - left; 
if (y -> left !- NULL) 
y -> left -> parent = x; 
y -> parent = x -> parent; 
if (x == header -> parent) // 如 果 x 是 根 
header -> parent = y; 
else if (x == x -> parent -> left) // 如 果 x 是 一 个 左 子 女 
X -> parent -> left = y; E 
else - | 
X -> parent - right = y; 
y -> left = x; 
X -> parent = y; 


} 


这 说 明 将 “惊动 ”多 多 少 个 父 节 点 | 但 古人 欠 乐 现 的 角度 来 说 ， BARES, 时 间 是 
常数 。 

右 旋 转 又 怎么 样 呢 ? 图 9- .4 显示 了 一 个 简单 的 例子 ， 围绕 100 进 行 右 旋 转 。 令 x 是 指向 树 节 
把 的 指针 ，y 是 指向 x 的 左 子女 的 树 节点 的 指针 。 那 么 围绕 x 进 行 的 右 旋转 基本 可 由 两 个 步骤 
完成 : 

x->left=y->right; 
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y->right=x; 

当然 ,一旦 包括 了 父 市 点 的 调整 ， 那 么 方法 长 度 将 会 大 量 增加 ， 但 时 间 仍 然 是 常数 。 实 
际 上 ， 如 末 将 rotate_left 方 法 定义 中 的 left 和 right 进 行 交 换 ， 就 可 以 得 到 rotate_right 的 定义 ! 并 
且 如 同 左旋 转 一 样 ， 右 旋转 之 后 的 树 仍然 是 一 个 折 半 查找 树 。 

在 迄今 看 到 的 所 有 旋转 中 ， 树 的 高 度 都 是 减少 1。 这 没什么 可 奇怪 的 ; 实际 上 ， 减 少 高 度 
正 是 旋转 的 动机 。 但 是 并 非 每 个 旋转 都 必须 减少 树 的 高 度 。 例 如 ， 图 9-5 显 示 了 围绕 项 50 的 树 
广 扩 进行 的 左旋 转 ， 它 并 没有 影响 树 的 高 度 。 


100 90 
/ — LN 
90 50 100 


50 
图 9-4 围绕 100 进 行 的 右 旋转 


90 90 
50 100 70 100 


80 30 
图 9-5 围绕 50 进 行 的 左旋 转 。 旋 转 后 ， 树 的 高 度 仍然 是 3 


图 9-5 中 的 左旋 转 确实 没有 减少 树 的 高 度 。 但 是 通过 几 分 钟 的 测试 就 可 以 证 明 单 个 旋转 是 
不 能 减少 图 9-5 左 边 树 的 高 度 的 。 现 在 看 一 下 图 9-5 中 右边 的 树 ， 能 否 找到 一 个 旋转 可 减少 该 树 
的 高 度 呢 ? 不 能 围绕 70 进 行 右 旋转 ， 那 只 会 让 我 们 退回 出 发 点 。 那 么 围绕 90 进 行 右 旋转 昵 ， 
看 ! 图 9-6 显 示 了 结果 。 
图 9-5 和 图 9-6 中 的 旋转 可 以 看 作 一 组 :围绕 90 的 左 子女 进行 左旋 转 ， 随 后 围绕 90 进 行 右 旋 
和 村， 这 称 作 双 旋转 。 图 9-7 显 示 了 另 一 种 双 旋 转 : 围绕 50 的 右 子女 进行 右 旋转 ， 随后 再 围绕 50 
进行 左旋 转 。 
这 里 是 旋转 的 主要 属性 。 
在 继续 深入 讨论 之 前 ， 我 们 先 来 看 一 下 旋转 的 主要 特点 : 
1) 有 四 种 旋转 一 一 
a. 左旋 转 ; 
b. 右 旋 转 ; 
c. 围绕 某 项 的 左 子女 进行 左旋 转 ， 随 后 再 围绕 该 项 自身 进行 右 旋转 : 
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d. 围绕 某 项 的 右 子 女 进行 右 旋转 ， 随 后 再 围绕 该 项 目 身 进行 左旋 转 。 

2) 不 在 旋转 所 围绕 项 的 子 树 中 的 节点 是 不 受 旋转 影响 的 。 

3) 旋转 耗费 常数 时 间 。 

4) 旋转 之 前 和 之 后 的 树 都 是 折 半 查找 树 。 

5) 左旋 转 的 代码 和 右 旋 转 的 代码 是 对 称 的 《反之 亦 然 )， 只 需要 简单 地 交换 left 和 和 right。 


入 人 八 


10 80  ——h 10 70 _> 50 80 


A NCP A 


90 80 10 75 90 


\ /\ 


75. | 75 90 
图 9-7 MER: 围绕 50 的 右 子女 进行 右 旋转 ， 随 后 再 围绕 50 进 行 左旋 转 
9.3 广 介绍 了 一 种 基于 折 半 查找 树 的 数据 结构 一 一 AvL 树 ， 不 过 它 使 用 了 旋转 保持 平衡 。 


9.3 AVL 


AVL 树 的 一 个 递归 定义 。 

AVL 炳 是 一 个 折 半 查找 树 ， 它 或 者 为 空 ， 或 者 具有 下 面 的 两 个 属性 : 

1) 左 子 树 和 右 子 树 的 高 度 之 差 至 多 为 1。 

2) 左右 子 树 都 是 AVL 树 。 

AVL 树 是 根据 它们 的 开发 者 一 一 两 个 俄国 数学 家 ， Adel’ son-Vel' skii 和 Landis_ 命名 的 
( 见 Adel’” son-Vel skii and Landis, 1962 )。 图 9- 8 显示 了 三 个 AVE 树 ， 图 9- -9 显示 了 三 个 不 是 
AVLBIUT 2E de Heb. 

图 9-9 中 第 一 个 树 不 是 AVL 树 ， BA EBACT RE E ih THAE- 1, 88 NAR 
是 AVL 树 ， 因为 它 的 左 子 树 和 右 子 树 都 不 是 AVEL 树 。 第 三 个 树 也 不 是 AVE 树 ， 因为 它 的 左 子 
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图 9-8 三 个 AVL 树 
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图 9-9 三 个 不 是 AVL 树 的 折 半 查找 树 


9.3.1 布 中 将 说 明 AVL 树 是 一 个 平衡 的 折 半 查找 树 ， 也 就 是 说 ，AVL 树 的 高 度 minka 

数 关 系 的 。 这 和 一 般 的 折 半 查找 树 一 最 坏 情 况 下 高 度 和 n 成 线性 关系 (比如 链 ) 

”上 明 的 对 比 。 线 性 和 对 数 之 间 的 差别 是 非常 大 的 ， 例 如 ， 假 设 n=1 000 000 000 000, Pálon 
359| “小 于 40。 


9.3.1 AVL 树 的 高 度 | 


可 以 证 明 AVL 树 的 高 度 和 "成 对 数 关系 ， 而 且 该 证 明 过 程 中 又 涉及 到 了 韭 波 纳 邵 数 ， 
AVL 树 的 高 度 和 树 中 项 的 数量 mn 成 对 数 关系 。 


声明 AN 个 非 空 AVIL 树 ， Weigh (nA BRR Jeno EMER 





OER, REENER- AVL pln SEK, LORD RORRGER 

如 何 求 出 n 个 项 的 AVL 树 可 能 的 最 大 高 度 呢 ? 正如 Kruse(1987) 提 出 的 ， 重 新 分 析 问 
S 题 有 助 于 得 出 答案 。 给 定 高 度 4， 那 么 任意 - Cr BEE AV Lp OR MR 
£41 
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对 jn=0,12,……， 令 min, 是 高 度 为 h 的 AVL 树 中 项 的 最 小 数量 。 很 明显 ，mino=1 而 mini=2 
min; 和 min; 的 值 可 以 参考 下 面 的 AVL 树 : 


50 90 


39 80 50 100 
39 80 129 


60 


| — ROC. 如 果 h1>h2， 那么 min,: 大 于 构造 高 度 为 h2 的 AVL 树 需要 的 项 的 数量 。 也 就 是 说 ， 
如 果 hh1>h2， 那么 min,>min,,。 换 句 话说 ， min; 是 一 个 递增 函数 。 
假设 :是 高 度 为 的 AVL 树 且 包 含 min, 个 项 ，h>1。 那 么 怎样 描述 的 左 、 右 子 树 的 高 度 呢 ? 
根据 高 度 的 定义 ， 这 两 个 子 树 之 一 必定 有 一 个 的 高 度 是 h~-1。 同 样 根据 AVL 树 的 定义 ， 另 一 个 
子 树 的 高 度 必 定 是 h- 1 或 k-2。 实 际 上 ， 因 为 包含 了 该 高 度 的 树 中 最 少 的 项 ， 所 以 它 的 一 个 
子 树 的 高 度 必定 是 h-1 并 包含 min;, 个 项 ， 而 另 一 个 子 树 的 高 度 必定 是 h-2 并 包含 min;, 个 项 。 
树 中 的 项 总 是 比 它 的 左 子 树 和 右 子 树 中 项 的 数量 多 1。 因 此 有 
min = min,,+min,,+1 7 是 任意 >1 的 整数 
这 个 递 推 关系 看 起 来 非常 像 生 成 斐 波 纳 契 数 的 公 式 。 术 语 斐 波 纳 契 树 就 是 指 对 应 高 度 上 Beo] 
项 数量 最 少 的 AVL 树 。 根 据 递 推 关系 以 及 mino 和 min, 的 数值 ， 可 以 对 h 进 行 归纳 证 明 : 
| min,= fib (h+3)-1 ”4h 是 任意 非 负 整数 
例如 ， 因 为 mins=33 而 且 min;=54， 所 以 包含 50 个 项 的 AVL 树 的 最 大 高 度 是 6。 
还 可 以 进一步 对 h 进 行 归纳 证 明 (参阅 习题 9.5): 
| 2s. fib(h+3)-1> Q2 ”4 是 任意 非 负 整数 
NERA HUR ROERERI 
| min, > (3/2)' h 是 任意 非 负 整 数 
| 以 2 为 底数 《可 以 使 用 任何 底数 ) 取 对 数 ， 将 得 到 
B log;min, > hlog,(3/2) | jp 是 任意 非 负 整数 
将 这 个 公式 重 写 成 适合 大 0 声明 的 形 起， 由 于 llog:(1.5)<1.75， 故 : 
h < 1.75log,min, h 是 任意 非 负 整数 | 
如 果 t 是 高 度 为 h 的 包含 a 个 项 的 AVL 树 ， 那 么 一 定 有 min, <n, B 因此 对 任意 这 样 的 AVL 树 ， 
h<1.75log,n o 
也 就 是 说 ， 即 使 在 最 坏 情 况 下 ， 任何 包含 4 个 项 的 AVL 树 的 高 度 都 是 O(logn)。 
| 这 意味 着 任意 AVL 树 的 高 度 都 是 O(logn)。 那么 O(logn) 是 最 小 上 界 吗 ? 是 的 ， 下 面 说 明 原 
因 。 根 据 二 又 树 定理 的 第 二 部 分 ， 对 任意 高 度 为 h 包 含 n 个 项 的 二 又 树 来 说 | 





| o2 
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h > log, (n+1)-1 
因此 可 以 断定 ， 即 使 在 最 坏 情况 下 ， 任 何 一 个 包含 ”个 项 的 AVL 树 的 高 度 也 是 和 z 成 对 数 
为 了 更 好 地 说 明 AVL 树 和 折 半 查找 树 的 关系 ， 我 们 将 在 9.3.3 节 和 9.3.4 节 中 设计 并 实现 
AVLTree 类 。 


93.2 BAR 


dj We Et Acpej—^4p £. APERT AKARA, operator(). . 

在 开始 设计 和 实现 AVLTree 类 之 前 ， 还 需要 介绍 一 个 重要 的 概念 一 一 函数 对 象 。 函 数 对 
象 一 一 也 称 作 隧 子 ， 是 类 中 的 一 个 对 象 ， 其 中 重 载 了 函数 调用 运算 符 operator()。 被 重 载 的 
operator() 所 在 的 类 称 作 函数 类 或 函 子 类 。 例 如 ， 假设 函数 类 MyClass 按 如 下 方式 重 载 
operator(): 


int operator( ) (int i) 
{ 


return 5 * i; 
} // operator( ) 


那么 可 以 编写 
MyClass d; 


cout << d (15); 


在 输出 语 名 中， 对象 d 看 起 来 像 一 个 函数 ， 这 也 就 是 术语 “函数 对 象 ”的 由 来 。 

但 是 函数 对 象 的 值 是 什么 呢 ? 回 想 一 下 模板 的 重要 性 。 前 面 已 经 看 到 过 一 些 例 子 ， 这些 
例子 表明 ， 模 板 提 供 了 项 类 型 的 灵活 性 ， 因 此 可 以 在 容器 类 中 使 用 各 种 各 样 的 项 类 型 。 模 板 
也 提供 了 运算 符 类 型 的 灵活 性 ， 这 样 就 可 以 在 容器 类 中 使 用 各 种 各 样 的 运算 符 。 下 面 几 段 将 
说 明 函 数 对 象 是 如 何 工 作 的 ， 以 及 模板 在 其 中 扮演 的 角色 。 

BinSearchTree 类 的 一 个 缺点 是 项 与 项 之 则 的 比较 必须 使 用 operator<。 这 在 很 多 应 用 中 


是 很 好 的 ， 但 并 非 对 所 有 的 应 用 都 是 如 此 。 例 如 ， 假 设 树 中 的 项 是 考试 成 绩 ， 并 希望 将 它们 


按 降序 存储 。 或 者 也 可 能 树 中 的 每 一 项 由 雇员 的 姓名 、 薪 水 和 部 门 组 成 。 一 个 应 用 可 能 希望 
分 部 门 、 每 个 部 门 内 按照 字母 顺序 将 雇员 存储 到 树 中 ; 而 另 一 个 应 用 又 可 能 希望 按照 薪水 的 
降序 将 雇员 存储 在 树 中 。 那 么 在 项 的 类 中 就 不 能 重 载 operator< 同 时 为 这 两 个 应 用 服务 。 

C++ 允许 类 的 用 户 为 某 一 具体 应 用 裁剪 设计 比较 关系 。 RAP RTH BL BLE BR E Rc 
AVLTree 类 的 定义 的 开头 是 : 


template<class T, class Compare> 
class AVLTree 


{ 
protected: 


Compare compare; 


compare 字 段 就 是 一 个 函数 对 象 的 例子 。 当 用 户 定义 一 个 AVLTree 容 器 时 ， 在 定义 中 会 包 
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含 重 载 operatorO 的 类 的 一 个 模板 变 元 。 例 如 ， 下 面 是 前 一 段 中 两 个 雇员 应 用 所 对 应 的 定义 : 


AVLTree< Employee, ByDivision< Employee > > avlt; 


AVLTree« Employee, ByDecreasingSalary< Employee > > avl2; 


对 avll 对 象 ， 雇员 将 根据 部 门 进 行 比较 ; 而 在 部 门 内 部 将 按照 字母 顺序 进行 比较 。 下 面 是 
ByDivision 类 的 定义 : 


template<class T> 
class ByDivision 
{ 
bool operator( ) (const T& x, const T& y) const 
{ 
if (x.division < y.division) 
return true; | 
if (x.division == y.division && x.name < y.name) 
return true; 
return false: 
} / BRO 
} // 类 ByDivision 


这 是 一 个 奇怪 的 类 : 没有 字段 ， 而 且 只 有 一 个 方法 ! 当然 ， 编 译 器 将 提供 一 个 缺 省 构造 
给 ， 但 是 这 个 构造 器 什么 也 不 做 ， 因 为 类 中 没有 字段 。 在 AVLTree 类 中 ， 函 数 对 象 compare 将 
赫 换 operator<。 例 如 ， 在 BinSearchTree 类 的 insert 方 法 中 有 

ifitem«child-»item) — 

AVLIree 类 中 相应 的 行 是 


if(compare(item,child->item)) 


X HLBS BORSE Si compare 1E AAA CHAKA operatoro. 结果 依赖 于 调用 insert 方 


法 的 AVLTree 对 象 。 如 果 它 是 av11 ， 那 么 当 item 的 部 门 小 于 child->item 的 部 门 时 ; 或 者 部 门 相 
同 ， 而 item 的 姓名 按照 字母 顺序 排 在 child->item 的 姓名 之 后 时 就 返回 true 

现在 已 经 知道 了 ByDivision 类 , 毫 无 疑问 也 可 以 得 到 ByDecreasingSalary 类 : 

template<class T> 

class ByDecreasingSalary 

{ | | 
bool operator( ) (const T& x, const T& y) const 
{ 


return x.salary > y.salary; 
} / BRO 
) / XByDecreasingSalary 


XX AY 1 E. RT BE S SD E IE PO BIB. 但 是 如 果 需 要 的 只 不 过 是 一 个 简单 的 
比较 ， 就 像 operator< 所 提供 的 ， 这 会 怎样 呢 ? 没有 问题 。 在 文件 <function> 中 ， 有 儿 个 预定 
义 的 类 ， 其 中 重 载 了 operator() 进 行 简单 的 比较 。 例如 ， 国 数 类 less 按 如 下 方式 重 载 了 


operator(): 
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bool operator( ) (const T& x, const T& y) const { return x < y; } 
因此 ， 如 采 只 是 想 在 AVLTree 对 象 中 用 operator< 比 较 int 项 ， 可 以 定义 
AVLTree< int, less<int> > myTree; | 


国 数 对 象 是 标准 模板 库 的 关联 容器 类 所 必须 的 ， 而 且 不 仅仅 能 用 在 专门 的 比较 上 。 实 验 
21 提 供 了 更 多 函数 对 象 的 细 记 ， 特 别 是 说 明了 它们 比 单纯 的 畏 数 有 更 强大 的 功能 。 


实验 21: 更 多 的 函数 对 象 的 细节 (所 有 实验 都 是 可 选 的 ) 


9.3.3 AVLTree 类 


除了 9.3.2 而 中 提 到 的 函数 对 象 特点 之 外 ，AVLTree 类 和 BinSearchTree 类 是 非常 相似 的 。 
AERD- size. find, insertfflerase, 它们 的 方法 头 是 相同 的 。 方 法 接口 中 惟一 的 不 同 是 
find、insert 和 和 erase 方 法 的 worstTime(n) 和 nn 成 对 数 关 系 。 这 是 因为 AVL 树 的 高 度 总 是 和 n 成 对 数 
AVLTree 类 将 包括 和 BinSearchTree 类 相同 的 字段 以 及 函数 对 象 compare: 
protected: 
Compare compare; 
tree node" header; 


unsigned node count; 


tree_node 类 是 被 扩展 过 的 。 除了 BinSearchTree 类 的 tree_node 结 构 的 五 个 字段 (item, 
parent, left, right, isHeader) 之 外 ， AVLTree 类 的 tree_node 结 构 又 增加 了 一 个 额外 的 字段 : 


char balanceFactor; 


te R— 5 & fjbalanceFactor 4829. 'L', At ZZ 69 E bp E SIE 484 $4 1. 
如 果 一 个 节点 的 balanceFactor 字 段 值 为 “= '， 那么 它 的 左右 子 树 高 度 相 同 。 如 果 
balanceFactor 字 段 值 为 ‘L’, 那么 它 的 左 子 树 高 度 比 右 子 树 高 度 大 1 。 如 果 balanceFactor 字 段 
值 为 “R ， 就 表示 它 的 右 子 树 高 度 比 左 子 树 高 度 大 1。 
除了 find、insert 和 erase 之 外 ， AVLTree 类 的 方法 定义 和 BinSearchTree 类 中 的 方法 定义 是 
完全 相同 的 。 AVLIree 类 的 find 方 法 使 用 了 函数 对 象 compare 取 代 了 operator<。 下 面 是 它 的 
定义 : 


Iterator find (const T& item) 
{ 
Link parent = header: 
Link child = header -> parent; 
while (child !— NULL) 
{ 
if (Icompare (child -> item, item)) 


parent = child; 





AVL #4 287 





child = child -> left; 
) // item "<=" child -> item 
else 
child = child -> right; 
) // while 
if (parent == header || compare (item, parent -> item)) 
return end( ); 
else 
return parent; 
) // find 


di] AVLTree3E sc Fil Hy 5 27 US CP A less, 3B 么 find 的 这 个 定义 就 是 和 BinSearchTree 
类 中 的 定义 等 价 的 。 例 如 ， 


AVLTree<string,less <string> >words; 


insert 方 法 的 定义 比 BinSearchTree 类 中 的 定义 要 稍微 复杂 些 。 大 量 的 详细 资料 说 明 保 持 对 
数 高 度 需要 很 高 的 代价 。 erase 方 法 的 定义 留 到 编程 项 目 9. Pm. 

下 面 是 insert 方 法 的 方法 接口 : 

// 后 置 条 件 : item 被 插入 到 这 个 AVLTree 中 ， 并 返回 位 于 这 个 新 插入 项 的 迭代 器 。 

If worstTime(n)#O(logn) , 

Iterator insert(const T& item); 

当 进 行 插入 时 ， 变 重 ancestor 保 存 了 平衡 因子 是 “L A R 的 、 被 插入 项 的 最 近 的 祖先 
(的 指针 )。 

insert 方 法 的 实现 是 基于 Horowitz 等 的 研究 的 (1965), AVLTree 类 中 和 前 insert 方 法 很 像 
BinSearchTree 类 中 的 insert 方 法 。 但 是 当 从 根 到 插入 点 沿 着 树 下 行 时 ， 需 要 明了 balanceFactor 
值 为 L’ 或 “R” 的 插入 节点 的 最 近 的 祖先 。 将 这 样 的 节点 称 作 ancestor。 例 如 ， 如 果 将 60 
插入 到 图 9-10 中 的 AVLTree 中 ， 那么 ancestor 就 是 项 为 80 的 节点 。 


50 


人 人、 

20 80 
/ | | Jon 
10 70 |. 100 


92 103 


图 9-10 包含 每 个 节点 的 相关 的 平衡 因子 的 AVIL 树 


在 项 按 眼 BinSearchTree 模 式 被 插入 到 AVLTree 对 象 中 之 后 ， 调用 一 个 修正 方法 处 理 旋转 
以 及 balanceFactor 字 7 段 的 调整 。 下 面 是 insert 方 法 的 定义 : 


Ww 





288 FOF 





Iterator insert (const T& item) 
{ 
if (header -> parent == NULL) 
{ 
insertltem (item, header, header -> parent); 
header -> left = header -> parent; 
header -> right = header -> parent; 
return header -> parent; 
) // 在 树 的 根部 进行 插入 
else 
{ 
Link parent = header, 
child = header -> parent, 
ancestor = NULL; 


while (child != NULL) 
{ 
parent = child: 
if (child -> balanceFactor != '=") 
ancestor = child; 
if (compare (item, child -> item)) 
child = child -> left; 
else 
child = child -> right; 


) // while 

if (compare (item, parent -> item)) 

{ 
insertltem (item, parent, parent -> left); 
fixAfterinsertion (ancestor, parent -> left) 
if (header -> left == parent) 

header -> left = parent -> left; // 最 左边 的 子女 

return parent -> left: 

) // 在 parent 的 左边 进行 插入 

else 


{ 


insertltem (item, parent, parent -> right); 
fixAfterInsertion (ancestor, parent -> right); - 
if (header -> right == parent) 
header -> right = parent -> right; / 最 右边 的 子女 

return parent -> right; 

) // 在 parent 的 右边 进行 插入 

) / 树 非 空 
) // insert 


insertltem 方 法 的 定义 和 BinSearchTree 类 中 insertItem 方 法 的 定义 惟一 的 区 别 就 是 将 
balanceFactor 字 段 的 值 设置 成 ‘=’， fixAfterInsertion 方 法 十 分 复杂 ， 下 面 专门 用 一 节 讲 述 这 
个 方法 。 
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9.3.4 fixAfterinsertion 方 法 


下 面 是 fixAfterInsertion 方 法 的 方法 接口 (回忆 一 下 ，Link 只 是 tree_node* 的 简化 ): 
/后 置 条 件 : 如 果 需 要 的 话 ， 就 恢复 AVL 属 性 ， 可 以 通过 在 被 插入 的 tree_node 和 离 它 

i Rit AbalanceFactor#'L'sy'R'A EZ [8] 3E 17 Jie S DL ERAT 869) 

if 调整 来 实现 。 

void fixAfterlnsertion(Link ancestor, Link inserted); 


fixAfterInsertion 方 法 的 定义 的 开头 是 root 和 item 的 定义 : 

Link root=header->parent; 

T item=inserted->item; 

方法 的 剩余 部 分 由 六 种 情况 组 成 。 选 择 哪 一 个 情况 完成 方法 依赖 于 ancestor 节 点 的 
balanceFator 值 以 及 项 被 插入 的 位 置 。 

情况 1 

ancestor 为 NULL; 也 就 是 说 ， 被 插入 节点 的 每 个 祖先 的 balanceFactor 值 为 “=’。 调 整 这 
些 祖先 的 balanceFactor 值 然后 结束 。 例 如 ， 图 9-11 显 示 了 这 个 情况 之 前 和 之 后 的 树 。 在 图 9-11 
以 及 其 他 情况 的 所 有 图 中 ， 都 假定 函数 对 象 compare 是 less 类 的 一 个 实例 ， 因 此 compare(a, b) 
可 以 解释 成 a<b。 

它 的 结果 是 这 六 种 情况 的 每 一 个 都 包含 了 从 插入 节点 的 父亲 直到 插入 点 的 某 些 祖先 (但 
不 包括 它 ) 的 路 径 上 的 平衡 因子 调整 。 因 此 在 这 种 情况 里 采取 的 行动 是 调整 根 的 平衡 因子 ， 
然后 调用 adjustPath(root, inserted)。 下 面 是 方法 的 接口 : 

// 后 是 条件: 如 果 需 要 ， 就 调整 所 有 从 inserted 节 点 (不 包括 它 ) 到 to 节点 

// (不 包括 它 ) 之 间 的 节点 的 平衡 因子 ， 

void adjustPath(Link to,Link inserted): 

adjustPath 方 法 在 需要 时 调整 两 个 给 定 节点 (不 包括 本 身 ) 之 间 路 径 上 的 每 个 节点 的 平衡 
因子 。 


50 50 
25 70 25 70 
= = = L 
——Óe 
15 30 60 90 15 30 60 90 
55 55 


图 9-11 左边 是 调用 fixAfterInsertion 之 前 的 AVLTree 对 象 : 插入 的 项 是 55， 它 的 侈 部 
祖先 的 balanceFactor 值 都 是 ‘=’. 右边 是 调整 平衡 因子 之 后 的 AVLTree 对 象 


~] 
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adjustPath 方 法 从 inserted 节 点 沿 着 树 向 后 倒退 。 路 径 上 的 每 个 平衡 因子 当前 值 都 是 = 。 
通过 比较 播 和 项 和 给 定 节点 的 项 ， 可 以 求 出 路 径 上 任意 给 定 节 点 的 平衡 因子 。 有 具体 地 说 ， 如 
368] 果 插 入 项 小 于 给 定 项 ， 那 么 新 的 平衡 因子 应 该 是 “L ,否则 就 是 “R 。 下 面 是 定义 : 


void adjustPath (Link to, Link inserted) 
{ 


T item = inserted -> item; 


Link temp = inserted -> parent; 
while (temp != to) 
{ 
if (compare (item, temp -> item)) 
temp -> balanceFactor = 'L’; 
else 
temp -> balanceFactor = 'R'; 
temp = temp -> parent; 
) // while 
)// 方法 adjustPath 


E29 — ^ AV LES AY BE S Ain RRA. BUG JT CS RRR, DL E (S 
IIIJ worstTime(Qn) ah Ain jAOS RC: 3 e 
情况 1 的 全 部 操作 只 是 调整 根 的 平衡 因子 ， 然 后 调用 adjustPath 方 法 : 


if (ancestor == NULL) 
{ 
if (compare (item, root -> item)) _ 
root -> balanceFactor = 'L'; 
else 
root -> balanceFactor = 'R'; 
adjustPath (root, inserted); 
)/ 情况 1: 所 有 祖先 的 平衡 因子 都 是 = 


情况 2 

ancestor->balanceFactor 的 值 是 “L ” ， 并 且 在 ancestor 节 点 的 右 子 树 中 进行 插入 : 或 者 
ancestor->balanceFactor 的 值 是 “R ， 并 且 在 ancestor 季 点 的 左 子 树 中 进行 插入 。 举 例 说 明 这 
个 情况 的 应 用 ， 在 图 9-11 右 边 的 AVL 树 中 插入 28。 在 这 个 情况 ， 也 就 是 第 一 种 情况 的 if 语 句 . 
后 ， 将 ancestor 节 点 的 平衡 因子 设置 成 “=’ ， 然 后 对 inserted 和 ancestor 之 间 的 节点 进行 通常 的 


调整 : 
else if ((ancestor -> balanceFactor == 'L' && 
compare (item, ancestor -> item)) | 
(ancestor -> balanceFactor == 'R' && 
compare (item, ancestor -> item))) 
369 { | 


ancestor -> balanceFactor = '=': 
adjustPath (ancestor, inserted); 


}V 情况 2: 在 和 ancestor 的 平衡 因子 相反 的 子 树 中 进行 插入 
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图 9-12 显 示 了 这 种 情况 之 前 和 之 后 的 树 。 


Jn | S/N 
25 70 25 70 
- L R 7 L 
—————» 
15 30 60 90 15 30 60 90 
fo HF) 
28 55 28 55 


图 9-12 左边 是 刚 插 入 28 后 的 AVL 树 。 其 他 节点 的 平衡 因子 都 是 村 入 前 的 。 右 边 是 调整 
平衡 因子 之 后 的 同一 个 AVL 树 。 调 整 的 只 是 从 28 到 50 之 间 的 路 径 上 的 平衡 因子 


剩余 的 四 种 情况 都 需要 通过 旋转 重新 平衡 树 : 左旋 转 ， 右 旋转 ， 左 - 右 旋 转 以 及 右 - 左 旋 
转 。 在 每 次 这 样 的 旋转 之 后 ， 主要 是 通过 调用 adjustPath 方 法 调整 平衡 因子 。 

情况 3 

ancestor->balanceFactor 的 值 是 ‘“R”， 并 且 被 插入 节点 是 在 ancestor 节 点 的 右 子 树 的 右 子 树 
之 中 。 在 这 个 情况 中 ， 围 绕 ancestor 节 点 进行 了 一 个 左旋 转 。 下 面 是 代码 : 


else if (ancestor -> balanceFactor == 'R' && 
lcompare (item, ancestor -> right -> item)) 
{ 
ancestor -> balanceFactor = '='; 
rotate_left (ancestor); | 
adjustPath (ancestor -> parent, inserted); 


) // 情况 3: 在 ancestor 的 右 子 树 的 右 子 树 中 插入 


图 9-13 说 明了 这 种 情况 。 

情况 4 

ancestor->balanceFactorfy {fi ‘L’, 并 且 在 ancestor 节 点 的 左 子 树 的 左 子 树 中 进行 插 人 。 
在 这 个 情况 中 ， 围 绕 ancestor 节 点 进行 了 一 个 右 旋 转 : 


else if (ancestor -> balanceFactor == 'L' && 
compare (item, ancestor -> left -> item)) 
{ 
ancestor -> balanceFactor = '='; 
rotate_right (ancestor); 
adjustPath (ancestor -> parent, inserted); 


| // 在 ancestor 的 左 子 树 的 左 子 树 中 进行 插入 


oJ 
e 
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25 70 25 90 
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图 9-13 左边 是 播 信 93 后 变 得 不 平衡 的 AVL 树 。 其 他 节点 的 平衡 因子 都 是 插入 前 的 。 
在 这 个 情况 里 ，ancestor 是 包含 项 70 的 节点 。 需 要 围绕 70 进 行 一 个 左旋 转 。 
右边 是 调整 平衡 因子 后 重 构 的 AVL 树 


图 9-14 说 明了 这 种 情况 。 
20 


图 9-14 左边 是 插入 13 后 变 得 不 平衡 的 AVL 树 。 其 他 节点 的 平衡 因子 都 是 插入 前 的 。 
在 这 个 情况 里 ，ancestor 是 包含 项 50 的 节点 。 需 要 围绕 590 进行 一 个 右 旋转 。 
右边 是 调整 平衡 因子 后 重 构 的 AVL 树 
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情况 5 

ancestor->balanceFactor É Æ ‘L’, 并 且 在 ancestor 节 点 的 左 子 树 的 右 子 树 中 进行 插入 。 
在 这 个 情况 中 ， 围 绕 ancestor 节 点 的 左 子女 进行 一 个 左旋 转 ， 然 后 围绕 ancestor 节 点 进行 一 
个 右 旋转 。 在 adjustLeftRight 方 法 中 处 理 balanceFactor 的 调整 ， 在 情况 5 的 代码 之 后 将 讨论 
该 方法 。 

下 面 是 情况 5 的 代码 : 

else if (ancestor -> balanceFactor == 'L' && 

Icompare (item, ancestor -> left -> item)) 


{ 
rotate_left (ancestor -> left); 
rotate_right (ancestor); 
adjustLeftRight (ancestor, inserted); 

) // 在 ancestor 的 左 子 树 的 右 子 树 中 进行 插入 


adjustLeftRight 的 方法 接 日 如 下 : 
/ 后 置 条 件 : 在 进行 左 - 右 旋转 之 后 ， 调 整 从 inserted (不 包括 在 内 ) 


// 到 ancestor 的 兄弟 (包括 在 内 ) 的 路 径 上 所 有 的 
H 平衡 因子 。 | 
void adjustLeftRight (Link ancestor, Link inserted); 
50 40 
Pa -一 人 人 
30 30 50 


图 9-15 左边 是 插入 40 后 变 得 不 平衡 的 AVL 树 。 其 他 节点 的 平衡 因子 都 是 插入 前 的 。 
在 这 个 情况 里 ，ancestor 是 包含 项 50 的 节点 。 需 要 围绕 30 进 行 一 个 左旋 转 ， 
随后 再 围绕 50 进 行 一 个 右 旋转 。 右 边 是 调整 平衡 因子 后 重 构 的 AVL 树 


这 个 方法 需要 情况 5 的 三 个 子 情况 。 最 简单 的 子 情况 (情况 5a) 是 如 图 9-15 所 示 的 最 简单 
的 左 - 右 旋转 。 在 这 个 子 情 况 中 ， 惟 一 的 修改 是 将 ancestor 节 点 的 balanceFactor 字 段 设 置 成 

马 外 两 个 子 情 况 的 确定 是 通过 在 插入 项 和 ancestor 节 点 旋转 后 的 父亲 之 间 进 行 比较 来 进 
行 。 图 9-16 说 明了 这 两 个 子 情况 中 的 前 者 (情况 5b)。 因 为 35 小 于 ancestor 节 点 的 父亲 (40), 
35 最 终 在 左 子 树 而 不 是 右 子 树 中 ， 因 此 ancestor 节 点 的 balanceFactor 字 段 的 值 是 “R’ 。 重 新 平 
衡 的 路 径 是 从 插入 项 直到 ancestor 节 点 的 兄弟 (不 包括 在 内 ): 


else if (compare (item, ancestor -> parent -> item)) 
{ 

ancestor -> balanceFactor = 'R'; 

adjustPath (ancestor -> parent -> left, inserted); 
) // 情况 5b: item"<"ancestor 的 父亲 的 项 
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图 9-16 左边 是 插 和 人 35 后 变 得 不 平衡 的 AVL 树 。 其 他 节点 的 平衡 因子 都 是 插入 前 的 。 
在 这 个 情况 里 ，ancestor 是 包含 项 50 的 节点 。 需 要 围 线 20 进 行 一 个 左旋 转 ， 
随后 再 围绕 50 进 行 一 个 右 旋 转 。 右 迪 是 调整 平衡 因子 后 重 构 的 AVL 树 
图 9-17 说 明了 最 后 一 个 子 情况 (情况 5c)， 当 插入 项 最 终 位 于 ancestor 节 点 的 父亲 的 右 子 树 
中 时 。 在 这 个 子 情况 里 ，42 最 终 在 ancestor 节 点 的 父亲 (40) 的 右 子 树 中 ， 因 此 ancestor 节 点 


的 balanceFactor 值 是 “=' ， 并 且 ancestor 节 点 的 兄弟 (20) 的 平衡 因子 是 “EL 。 


八 一 人 人、 


“AAA 
AA 
/ 


2o | 


| /N / A 


图 9-17 IRA AADIEEB GE GRAVES, 其 他 节点 的 平衡 因子 都 是 插入 前 的 。 
在 这 个 情况 里 ，ancestor 是 包含 项 50 的 节点 。 需 要 围绕 20 进 行 一 个 左旋 转 ， 
随后 再 围绕 50 进 行 一 个 右 旋转 。 右 边 是 调整 平衡 因子 后 重 构 的 AVL 树 
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这 个 子 情况 的 代码 是 : 

else 

{ 
ancestor -> balanceFactor = '="'; 
ancestor -> parent - left -> balanceFactor = 'L' 
adjustPath (ancestor, inserted); 

) // 情况 5c: item">"ancestor 的 父亲 的 项 


情况 6 

ancestor->balanceFactor 的 值 是 “R ， 并 且 插 入 的 节点 是 在 ancestor 节 点 的 右 子 树 的 左 子 树 
中 。 在 这 个 情况 里 ， 围 绕 ancestor 节 点 的 右 子 女 执 行 一 个 右 旋转 ， 然 后 再 围绕 ancestor 节 点 进 
行 一 个 左旋 转 。 和 情况 5 一 样 ， 情 况 6 也 有 三 个 子 情况 。 幸 运 的 是 ， 它 们 和 情况 5 的 三 个 子 情况 
是 对 称 的 。 例 如 ， 图 9-18 说 明了 情况 6b， 其 中 插入 项 最 终 在 ancestor 和 节点 的 (旋转 后 的 ) 父亲 
的 右 子 树 中 。 


50 70 
R = 
———— 
20 80 50 80 
70 90 20 75 90 


a 


75 


图 9-18 左边 是 插入 75 后 变 得 不 平衡 的 AVL 树 。 其 他 节点 的 平衡 因子 都 是 插入 前 的 。 
在 这 个 情况 里 ，ancestor 是 包含 项 50 的 节点 。 需 要 围绕 80 进 行 一 个 右 旋转 ， 
随后 围绕 50 进 行 一 个 左旋 转 。 右 边 是 调整 平衡 因子 后 重 构 的 AVL 树 


因为 75 最 终 在 70 的 右 子 树 中 ， 所 以 50 (也 就 是 ancestor 节 点 ) 的 balanceFactor 字 段 的 值 被 
设置 成 “L’ 。 下 面 是 adjustRightLeft 方 法 的 完整 定义 : 


void adjustRightLeft (Link ancestor, Link inserted) 
{ 


T item = inserted -> item; 


if (ancestor -> parent == inserted) // 情况 6a 
ancestor -> balanceFactor = '='; 
else if (Icompare (item, ancestor -> parent -> item)) 
{ 
ancestor -> balanceFactor = 'L': 
adjustPath (ancestor -> parent -> right, inserted): 
) // 情况 6b: item >="ancestor 的 父亲 的 项 


ua 
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ancestor -> balanceFactor = '='; 
ancestor - parent -> right -> balanceFactor = 'R’; 
adjustPath (ancestor, inserted); 
) // 情况 6c: item"«"ancestorf3 $2 FAM 
}/ 方法 adjustRightLeft 


最 后 是 包括 全 部 六 种 情况 的 fixAfterInsertion 方 法 : 


void fixAfterInsertion (Link ancestor, Link inserted) 


{ 


Link root = header -> parent; 
T item = inserted - item; 


if (ancestor == NULL) 
{ 
if (compare (item, root -> item)) 
root -> balanceFactor = 'L'; 
else 
root -> balanceFactor = 'R’; 
adjustPath (root, inserted); 
} / 情况 1: 所 有 祖先 的 平衡 因子 都 是 '=' 
else if ((ancestor -> balanceFactor == 'L' && 
icompare (item, ancestor -> item)) || 
(ancestor -> balanceFactor == 'R' && 
compare (item, ancestor -> item))) 


ancestor -> baianceFactor = '='; 
adjustPath (ancestor, inserted); 
) // 情况 2: 在 和 ancestor 的 平衡 因子 相反 的 子 树 中 进行 插入 
else if (ancestor -> balanceFactor == 'R' && 
Icompare (item, ancestor -> right -> item)) 
{ | 
ancestor -> balanceFactor = '="'; 
rotate left (ancestor); 
adjustPath (ancestor -> parent, inserted); 
) / 情况 3: 在 ancestor 的 右 子 树 的 右 子 树 中 插入 
else if (ancestor -> balanceFactor == 'L' && 
compare (item, ancestor -> left -> item)) 


ancestor -> balanceFactor = '='; 
rotate_right (ancestor); 
adjustPath (ancestor -> parent, inserted): 
} // 情况 4: 在 ancestor 的 左 子 树 的 左 子 树 中 进行 插入 
else if (ancestor -> balanceFactor == 'L' && 
lcompare (item, ancestor -> left -> item)) 


{ 


rotate left (ancestor -> left); 


x 
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rotate_right (ancestor); 

adjustLeftRight (ancestor, inserted); 
}/ 情况 5: 在 ancestor 的 左 子 树 的 右 子 树 中 进行 插入 
else 


{ 
rotate_right (ancestor -> right); 
rotate_left (ancestor): 
adjustRightLeft (ancestor, inserted); 


) // 情况 6: 在 ancestor 的 右 子 树 的 左 子 树 中 进行 插入 
\}4 方法 tixAfterinsertion 


还 需要 证 实 insert 方 法 的 正确 性 和 效率 。 首 先 处 理 正确 性 。 
9.3.5 insert 方 法 的 正确 性 


我 们 需要 证 明 : 如 果 在 调用 insert 方 法 之 前 AVLTree 对 象 是 一 个 AVL 树 ， 那 么 在 调用 之 后 
调用 对 象 仍然 是 一 个 AVL 树 。 旋 转 保 持 了 折 半 查找 树 的 属性 ， 这 样 剩 下 的 工作 只 是 去 证 实 左 
子 树 和 右 子 树 的 高 度 之 差 至 多 是 1， 而 且 这 两 个 子 树 也 都 是 AVL 树 。insert 方 法 使 用 了 平衡 因 
了 于， 和 而 不 是 直接 去 计算 高 度 。 需 要 证 明 平衡 因子 能 真实 地 反映 高 度 ; 也 就 是 说 ， 需 要 证 明 如 
末 在 调用 之 前 平衡 因子 是 正确 的 ， 那 么 在 调用 之 后 平衡 因子 也 仍然 是 正确 的 。 

实际 上 ， 在 fixAfterInsertion 方 法 的 六 种 情况 中 ， 惟 一 会 增加 整个 树 的 高 度 的 就 是 情况 1 
即 ancestor 的 值 为 NULL 的 情况 。 在 这 个 情况 中 ， 高 度 会 增加 的 只 有 那些 位 于 插入 项 (不 包括 
在 内 ) 到 根 项 (包括 在 内 ) 的 路 径 上 的 子 树 。 在 调用 之 前 ,所 有 这 些 子 树 的 平衡 因子 都 是 “=，、 
随后 将 根据 插入 项 是 “小 于 ”或 是 “大 于 等 于 ” 子 树 的 根 项 ， 而 把 该 子 树 的 平衡 因子 调整 成 
L ‘R. 

在 情 况 2 中 ， 假设 ancestor 节 点 的 平衡 因子 是 “L’， 并 且 在 ancestor 节 点 的 右 子 树 中 进行 插入 。 
那么 高 度 会 增加 的 只 有 那些 位 于 插入 项 (不 包括 在 内 ) 到 ancestor 的 项 (不 包括 在 内 ) 的 路 径 
上 的 子 树 ， 它 们 的 平衡 因子 也 会 相应 地 调整 。 而 且 ancestor 节 点 的 平衡 因子 也 被 设置 成 “=， 

图 9-19 说 明了 情况 3 一 一 左旋 转 情 况 一 一 的 结果 。 在 调用 insert 之 前 以 ancestor 市 点 为 根 的 子 
树 的 高 度 是 不 受 旋转 影响 的 。 除 了 这 个 子 树 之 外 ， 所 有 的 高 度 和 平衡 因子 都 是 不 受 影响 的 。 
情况 4 的 正确 性 证 明和 情况 3 是 对 称 的 。 


h-2 y z h-1 x h-1 2 h-1 


h —2 zl Qh-2 h-2 y zl h-2 
(+1) 
图 9-19 在 AVLTree 容 器 中 进行 左旋 转 。 项 + 代表 ancestor 节 点 ， 在 z2 的 子 树 中 进行 插 人 ， 
相应 的 高 度 用 黑体 表示 。 高 度 h 可 能 是 1， 因 此 y、zl 和 (插入 之 前 ) z2 可 能 是 NULL ， 
如 图 所 示 ， 子 树 的 高 度 一 一 以 及 由 此 推出 整个 树 的 高 度 一 一 是 不 受 旋 转 影 响 的 
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情况 5c 的 一 般 情 形 如 图 9-20 所 示 。 由 于 树 的 简单 性 ， 所 以 情况 5a 的 正确 性 是 很 容易 证 明 
的 。 情 况 5b 的 正确 性 可 以 用 一 个 和 图 9-20 相 似 的 图 证 明 ， 情 况 6 的 正确 性 证 明和 情况 5 是 对 
称 的 。 


h zh 
L Jm 
h-i v h—2 h-i w v h—1 
^^ R AN 
h-2 y z h—2 h-2 y zl h—3 h—2 z2 x h-2 
h—3 zl z2 h-3 


(+1) 


图 9-20 情况 5c 的 一 般 情形 : 在 z 的 右 子 树 中 进行 插入 。 左 边 的 ancestor 节 点 的 项 是 v。 先 围绕 
w 进 行 一 个 左旋 转 ， 随 后 再 围绕 v 进 行 一 个 右 旋转 。 高 度 h 可 能 只 是 2， 或 者 zl 和 z2 可 能 是 
NULL。 如 图 所 示 ， 子 树 的 高 度 一 一 以 及 由 此 推出 整个 树 一 一 是 不 受 旋转 影响 的 


运行 时 测试 可 以 进一步 增加 对 insert 方 法 正确 性 的 信任 。 构 造 一 个 大 小 为 4 的 AVL 树 ， 其 中 
n 的 值 是 由 终端 用 户 输入 的 。 树 中 的 每 一 项 都 是 随机 产生 的 ， 而 且 是 int 类 型 。 首 先 ， 这 里 用 
一 个 包装 方法 确保 折 半 查找 树 是 一 个 AVL 树 : 


/ 后 置 条 件 : 如 果 这 个 树 确实 是 一 个 AVLTree 就 返回 真 。 
// Aa, BER. 
bool isAVLTree( ) 
o 
return checkAVLTree( header -> parent ); 
) // Jj 3kisAVL Treo 


下 面 是 包装 的 方法 : 


l 后 置 条 件 : 检验 这 个 树 ， 确 保 左 右 子 树 (如 果 存 在 的 话 ) 的 高 度 差 在 1 之 内 ， 
// 而 且 这 些 子 树 都 是 AVL 树 。 
bool checkAVLTree (Link root) 
{ 
if (root == NULL) 
return true; 
else 
If ((abs (height (root -> left) — height (root -> right)) <= 1) 
&& (checkAVLTree (root -> left)) 
&& (checkAVLTree (root -> right))) 
return true; 
return false; 
) // checkAVL Tree 


最 后 是 主 函 数 的 基本 代码 : 
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for (i = 0; i <n i++) 
tree.insert (rand( )); 
if (tree.isAVLTree( )) 
cout << "success" << endi; 
else 
cout << "failure" << endl; 
cout << "height = "<< tree.height( ) << endl; 


当 输 入 10 000 作 为 nx 时， 结果 是 成 功 的 ， 也 就 是 说 该 树 的 确 是 一 个 AVL 树 。 

这 个 测试 有 助 于 分 析 insert 方 法 的 性 能 。 这 个 树 的 高 度 是 15， 和 10 000 个 项 的 AVL 树 的 最 
小 高 度 12.29 (—10g,10001—1) 相差 不 远 。 而 且 15 小 于 随机 产生 的 10 000 个 项 的 随机 产生 的 
BinSearchTree 对 象 的 平均 高 度 的 一 半 (和 参阅 实验 20)。 但 是 在 平均 情况 下 ，BinSearchTree 桥 
和 人 只 比 AVLTree 播 人 多 花费 一 点 点 时 间 ! 为 什么 ?因为 BinSearchTree 对 象 是 低 维护 容器 。 对 
每 个 AVLTree 对 象 ， 有 一 个 保险 策略 能 保证 树 的 高 度 总 是 和 n 成 对 数 关系 。 这 个 策略 能 让 你 平 
稳 地 进行 播 和 信 、 删 除 和 查找 ， 使 它们 的 worstTime(n) 和 n 成 对 数 关 系 。 该 策略 的 代价 是 在 插入 
和 删除 中 付出 额外 的 时 间 来 维护 AVL 树 的 属性 。 | 

包含 各 种 情况 和 子 情况 的 erase 方 法 的 定义 是 编程 项 目 9.1 的 目标 。9.4 节 提供 了 AVL 树 的 一 
个 应 用 : 检查 一 个 文档 中 的 单词 是 否 出 现在 字典 中 。 


9.4 AVL 树 的 应 用 : 一 个 简单 的 拼写 检查 器 


现代 字 处 理 器 最 有 用 的 特点 之 一 就 是 拼写 检查 ， 就 是 在 文档 中 扫描 可 能 的 拼写 错误 。 这 
里 说 “可 能 的 ”拼写 错误 是 因为 文档 中 可 能 包含 合法 但 不 在 字典 中 的 单词 。 例 如 ， 在 键入 本 
章 中 使 用 的 单词 “iterator” 和 “postorder” 时 ， 这 些 单词 就 被 看 作 是 字 处 理 器 所 找 不 到 的 。 

完整 的 问题 是 ， 给 出 dictionaryFile 中 的 一 个 字典 ， 以 及 由 用 户 提供 名 称 的 文件 中 的 一 个 文 
档 ， 输 出 在 文档 中 而 在 字典 里 找 不 到 的 所 有 的 单词 。 下 面 进行 一 些 简单 化 的 假设 : 

1) 字典 只 由 小 写 单 词组 成 。 

2) 文档 中 的 每 个 单词 只 由 字母 组 成 一 -其 中 可 能 有 一 些 或 全 部 是 大 写 的 。 


4) 字典 文件 是 按照 字母 顺序 排列 的 并 且 将 被 装 入 内 存 。 文 档 文件 不 必 按 照 字 母 顺序 排列 ， 
如 采 不 进行 复制 的 话 ， 它 也 将 被 装 入 内 存 。 

下 面 是 一 个 小 字典 文件 、 小 文档 文件 的 内 容 ， 以 及 出 现在 小 文档 文件 中 而 小 字典 文件 中 
却 没 有 的 单词 : 

I] 字典 文件 : 


3) 文档 中 的 每 个 单词 后 面 跟着 0 个 或 更 多 的 标点 符号 ， 随 后 是 任 意 数 量 的 空白 和 行 尾 
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than 

when 

where 

// 文档 文件 : 

When all is sed and done, 
more is said than done. 

/ 可 能 拼写 错 的 单词 


sed 
为 了 解决 这 个 问题 ， 创 建 一 个 包含 下 列 方法 的 SpellCheck 类 : 


/后 置 条 件 : 读 入 字典 文件 中 的 单词 。worstTime(n) 是 O(n log n)， 其 中 n 是 
/l 字典 文件 中 单词 的 数量 。 
void readDictionaryFile(); 


/后 置 条 件 : 读 入 文档 文件 中 的 单词 。worstTime(k) 是 O(k log k)， 其 中 k 是 
Il 文档 文件 中 单词 的 数量 。 


void readDocumentFile(); 


/后 置 条 件 : 输出 在 文档 中 而 不 在 字典 中 的 每 个 单词 。worstTime(k,n) 是 
i O(klogn) ， 其 中 k 是 文档 文件 中 的 单词 数量 ，n 是 字典 文件 中 的 单词 数量 . 


void compare(); 


这 里 仅 有 的 字段 是 用 来 保存 字典 文件 中 单词 的 dictionary ， 以 及 保存 文档 文件 中 特有 的 单 
词 的 words 一 一 因为 存储 一 个 单词 的 多 个 拷贝 是 毫 无 意义 的 。 这 两 个 字段 都 是 AVLTree 对 象 ， 


其 中 每 个 项 都 是 string 并 按照 字母 顺序 进行 string 的 比较 : 
protected: 


AVLTree<string, less<string> > dictionary, 
words; 


依赖 关系 图 如 下 : 
| dictionary 


SpellCheck 


words 


下 面 是 readDictionaryFile() 方 法 的 直接 定义 : 

void readDictionaryFile( ) { 
const string DICTIONARY FILE = "dictfile.dat"; 
fstream dictionaryFile; 


string word; 


dictionaryFile.open (DICTIONARY FILE.c str( ), ios::in) 
while (dictionaryFile >> word) 
dictionary.insert (word); 
) // readDictionaryFile 
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这 个 方法 将 耗费 多 长 时 间 呢 ? 假设 在 dictionaryFile 中 有 2 个 单词 ， 那 么 while 循 环 将 被 执 
f£rnik. BREAK In dictionary#t F— RBA. MAVLTreeM £ dictionary HAY BK A , 
worstTime(n) 4b Alin KIT KA, AlbreadDictionaryFileF 2 BJ worstTime(n)# O(nlogn), JF B. 
这 就 是 最 小 上 界 。 

readDocumentFile 的 定义 只 是 稍微 复杂 些 。 读 入 文档 文件 的 名 字 ， 然 后 再 读 入 文件 。 将 读 
入 的 每 个 单词 转换 成 小 写 ， 去 掉 尾部 的 标点 符号 (如果 有 的 话 )， 并 将 其 插入 words (除非 该 
单词 已 经 在 words 中 )。 下 面 是 完整 的 定义 : 


void readDocumentFile( ) 
{ 
const string DOCUMENT_FILE_PROMPT = 
"Please enter the name of the document file: "; 
fstream documentFile; 
string documentFileName, 
word; 


. cout << endl << DOCUMENT FILE PROMPT: 
cin >> documentFileName; 
documentFile.open (documentFileName.c_str( ), ios::in); 
while (documentFile >> word) 


{ | 
/ 将 单词 转换 成 小 写 : 
string temp; 
for (unsigned i = 0; i < word.length( ); i+ +) 
temp += (char)tolower(word [i]); 
word — temp; 


/ 去 掉 单 词尾 部 的 标点 符号 : 


while (lisalpha (word [word.length( ) —1})) 
word.erase(word.length( ) — 1); 


/ 将 单词 插入 words 除 非 它 已 经 在 words 中 : 
if (words.find (word) == words.end( )) 
words.insert (word); 


) // 当 documentFile 中 有 更 多 的 单词 
) / readDocumentFile 


完成 readDocumentFile 方 法 需要 花费 的 时 间 是 很 容易 估算 的 。 从 文件 中 读 入 k 个 单词 的 
worstTime(k) 和 kk 成 线性 关系 。 问 AVLTree 对 象 Words 中 插入 每 一 个 单词 的 worstTime() 是 和 kk 成 
对 数 关 系 的 。 因 此 ， 对 于 readDocumentFile 方 法 ， worstTime(k)#O(klogk), iti Hix tid Bh 
EF. | 

最 后 ， 也 是 最 容易 的 ， 是 compare 方 法 的 定义 : 

void compare( ) 

{ ' 

const string MISSPELLED = 
"Here are the possibly misspelled words:"; 


AVLTree< string, less< string > >::Iterator itr; 
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cout << endl << MISSPELLED << endl; 
for (itr = words.begin( ); itr {= words.end( ); itr+ +) 
if (dictionary.find (*itr) == dictionary.end( )) 
cout << "itr << endl: 
) // compare 


XS TOB et words rm AYA 8B ja] J worstTime(k) FOKKER A. thi JH find 7; i; 4Edictionaryftin 
个 单词 中 进行 查找 的 worstTime(n) 和 n 成 对 数 关 系 。 因 此 compare 的 worstTime(k,n) 是 O(klogn)， 
而 且 这 是 最 小 上 界 。 编 程 项 目 9.2 改 进 了 这 个 应 用 。 

在 第 13 章 中 将 遇 到 另 一 个 容器 类 一 一 hash_set 类 ， 它 也 不 属于 标准 模板 库 。 在 这 个 类 里 ， 
插入 、 删 除 和 查找 的 平均 时 间 基 本 上 是 常数 。 因 此 可 以 令 dictionary 和 words 字 段 是 hash_set 对 
象 ， 然 后 重 做 这 个 问题 。 不 需要 再 做 任何 其 他 的 改动 ! 对 该 版 本 的 拼写 检查 项 目 
readDictionaryFile 方 法 的 averageTime(m) 将 和 m 成 线性 关系 ，readDocumentFile 方 法 的 
averageTime(k) 将 和 Kk 成 线性 关系 。 而 compare 方 法 的 averageTime(k,n) 将 和 k 成 线性 关系 。 例 如 ， 
在 hash_set 版 本 的 拼写 检查 中 ， compare 方 法 的 worstTime(k,n) 将 是 OCkn)。 


总 结 

本 章 着 眼 于 改进 BinSearchTree 类 ， 确 保 树 在 每 次 插入 或 删除 之 后 是 平衡 的 ， 也 就 是 说 ， 
它 的 高 度 和 nn 成 对 数 关系 。 采 用 旋转 进行 重新 平衡 。 旋转 是 围绕 某 一 一 项 进行 的 树 的 调整 ， 它 使 
项 需要 的 顺序 保持 不 变 。 

AVL 树 是 一 个 折 半 查找 树 ， 它 或 者 为 空 ， 或 者 具备 下 面 两 个 属性 : 

1) 左 、 硬 子 树 的 高 度 之 差 至 多 为 1。 

2) 左 、 右 子 树 都 是 AVL 树 。 

AVL 树 的 高 度 总 是 和 树 中 项 的 数量 n 成 对 数 关 系 。 


习题 
9.1 在 下 面 的 每 个 折 半 查找 树 中 围绕 50 进 行 左旋 转 。 
a. 50 | 
~ 
N 70 
b 30 
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20 50 
JN 
40 80 
N CIN 
45 70 100 
60 75 
92 在 下 面 的 每 个 折 半 查找 树 中 国 线 50 进 行 右 旋转 。 
a. 50 
40 
30 
b 60 
ÁN 
ÁN 
/N 
C 30 
A 
45 70 100 
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9.3 在 下 面 的 折 半 查找 树 中 执行 双 旋 转 (围绕 20 进 行 左 旋转 ， 然 后 得 围绕 50 进 行 右 旋转 )， 
将 树 的 高 度 降低 成 2。 | 


50 
一 人 
20 90 
/N 
10 40 
/ 
30 


9.4 在 下 面 的 折 半 查找 树 中 执行 双 旋 转 ， 将 树 的 高 度 降低 成 2。 


50 
YN 
20 80 
SN 
70 100 
/ 
60 
9.5 证 明 对 和 任意 非 负 整数 h，fib(h+3)- 1 > (3/27 


提示 hl, 
(3/2) (3/2)? = (3/2)*?(3/2+1) > (3/2)*2(9/4) 


9.6 假设 将 max; 定 义 为 一 个 高 度 为 kh 的 AVL 树 中 项 的 最 大 数量 。 
a. 计算 max;。 
b. 对 任意 h 20, Atti max, MAAK. 


HR 使 用 第 8 章 的 二 又 树 定 理 的 第 2 部 分 。 


c. 包含 100 个 项 的 AVL 树 的 最 大 高 度 是 多 少 ? 
9.7 证 明 包含 32 个 项 的 任意 AVL 树 的 高 度 都 恰好 是 5。 


提示 it Hmax,Femin,, 

9.8 在 AVLTree 类 中 ， 开 发 一 个 worstTime(n) 是 Odogn) 的 height0 方 法 ， 

提示 树 节 点 的 平衡 因子 指示 了 它 的 哪 一 个 子 树 高 度 更 大 一 些 ， 

9.9 AVLTree 类 中 的 find 方 法 的 worstTime(n) 和 nn 成 对 数 关 系 。 BinSearchTree 类 中 的 find 方 


法 的 worstTime(n) 和 n 成 线性 关系 。 但 是 这 两 个 方法 的 定义 是 相同 的 (除了 用 因数 对 象 
compare 替 换 了 operator<) ! 解释 原因 。 
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编程 项 目 9.1: AVLTree 类 的 erase 方 法 


定义 AVLTree 类 中 的 erase 方 法 。 下 面 是 方法 接口 : 


// 前 置 条 件 : itr 位 于 这 个 AVLTree 的 某 一 项 上 。 
1// 后 置 条 件 | 从 这 个 AVELTree 中 删除 itr 位 置 上 的 项 。wofrstTime 是 DO(logn)。 


if (在 这 次 调用 之 前 位 于 *itr 之 后 的 所 有 和 迭代 器 都 将 失效 ) amortizedTime(n) 
// 是 常数 ， 因 此 averageTime(n) 是 常数 。 


void erasev(Iterator itr) 


提示 “在 执行 一 个 BinSearchTree 方 式 的 删除 之 后 ， 令 ancestor 为 实际 上 被 删除 节点 的 
父亲 。( 如 果 "*itr 有 两 个 子女 ， 那 么 实际 上 被 删除 的 节点 中 保存 了 "itr 的 后 任 ， 因 此 
ancestor 节 点 将 是 这 个 后 任 的 父亲 。) 循环 直到 这 个 树 成 为 包含 适当 平衡 因子 的 AVL 
树 。 在 循环 中 ， 假 设 删 除 的 项 位 于 ancestor 节 点 的 右 子 树 中 (对 称 的 分 析 可 以 处 理 左 
子 树 )。 那 么 根据 ancestor 节 点 的 平衡 因子 是 “= "，‘L ”或 “RR” 可 分 三 个 子 情况 。 在 
全 部 这 三 个 情况 中 都 必须 调整 ancestor 节 点 的 平衡 因子 。 st ‘=’ FW, ARAL, 
对 “R” 子 情况 ， 用 (*ancestor).parent 节 点 替换 ancestor 节 点 并 继续 循环 。 对 'L' F 
JL, Ri ancestor) left Ah ERFA =, L’, RO 又 分 成 三 种 子 情 况 。 
AH R? 子 - 子 情况 又 包含 了 三 个 子 - 子 - 子 情 况 ! 


编程 项 目 9.2: 改进 的 SpellChecker 项 目 


修改 拼写 检查 项 目 。 如 果 文 档 单词 x 不 在 字典 中 而 单词 在 字典 中 ， 且 x 和 y 的 差别 或 者 是 
相 邻 字母 的 调换 ， 或 者 是 单个 字母 的 差别 ， 那 么 y 应 当 作 为 x 的 一 个 选择 。 例 如 ， 假 设 文档 单 
词 是 “asteriks” 而 字典 包含 了 “asterisk”。 通 过 调换 “asteriks” 中 相 邻 的 字 和 县 ^s" AM "k^, 
可 以 得 到 “asterisk 。 因 此 “asterisk” 应 当 看 作 是 一 种 选择 。 同 理 ， 如 果 文 档 单词 是 
"seperate" zk "seprate", ， 而 字典 单词 是 “separate”， 那 么 “separate” 也 将 作为 这 两 种 情况 的 

下 面 是 两 个 系统 测试 的 字典 单词 : 

a 

algorithms 

asterisk 

coat 

equals 

he 

pied 

pile 

plus 

programs - 

separate 

structures 


WOre 
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下 面 是 文档 文件 doc1.dat: 


She woar a pide coat. 


下 面 是 另 一 文档 文件 doc2.dat: 
Alogrithms plus Data Structures equals Pograms 


系统 测试 1 (输入 用 黑体 表示 ) 


In the Input line, please enter the name of the document file. 
doc1.dat 





Possible miss Possible alternatives 
pide ‘ pied, pile 
she he ^ 





f 


PIF 











第 10 章 红 黑 树 


本 章 介绍 了 另 一 种 平衡 折 半 查找 树 一 一 红 黑 树 。 红 黑 树 的 高 度 限制 不 像 AVL 树 那么 严格 ， 
但 也 仍然 是 和 n 成 对 数 关系 的 。 在 红 黑 树 中 进行 插入 和 删除 的 算法 比 在 AVL 树 中 进行 插入 和 删 
除 的 算法 要 稍微 难 一 些 。 研 究 红 黑 树 的 主要 优点 在 于 它们 是 惠普 实现 中 标准 模板 库 的 关联 容 
釉 类 一 一 Set、mnultiset、map 和 multimap 一 一 的 基础 。 本 章 中 也 将 探讨 这 些 关 联 容器 类 。 


目标 


D 解释 红 黑 树 是 平衡 折 半 查找 树 的 原因 。 

2) 能 够 理解 红 黑 树 中 的 插入 或 删除 方法 。 

3) 理解 集合 与 多 集合 、 映 射 与 多 映射 之 间 的 区 别 。 
4) 比较 关联 数组 和 普通 数组 。 


10.4 红 黑 树 


基本 上 红 黑 树 就 是 一 个 折 半 查找 树 ， 树 中 的 每 个 节点 都 采用 了 一 种 彩色 约定 。 具 体 地 说 ， 
根据 下 面 马 上 要 给 出 的 规则 为 树 的 每 一 项 关联 一 个 红颜 色 或 一 个 黑 颜 色 。 规 则 之 一 涉及 到 路 
径 。 回 忆 在 第 8 章 中 ， 如 果 项 4 是 项 的 一 个 祖先 ， 那 么 4 到 8 的 路 径 是 从 A 开始 到 8 结束 的 项 的 
序列 ， 其 中 序列 中 的 每 一 项 都 是 下 一 项 的 父亲 。 

我 们 将 重点 关注 从 根 到 没有 子女 或 只 有 1 个 子女 的 项 之 间 的 路 径 9。 例 如 ， 在 下 面 的 树 中 
有 五 条 从 根 到 没有 子女 或 一 个 子女 的 项 ( 方 框 中 的 ) 之 间 的 路 径 。 





30 





注意 一 条 路 径 是 到 有 一 个 子女 的 项 40 的 。 因 此 刚才 描述 的 路 径 不 一 一 定 必 须要 到 达 树 叶 。 
每 个 红 黑 树 都 必须 满足 红 色 规 则 和 路 径 规则 。 


O “可 以 等 价 地 考虑 从 根 项 到 一 个 空子 树 的 路 径 ， 因为 一 个 树叶 有 两 个 空 于 树 而 有 一 个 子女 的 项 也 有 一 个 
子 树 。 当 采取 这 种 方法 时 ， 就 扩展 折 半 查找 树 ， 为 每 个 这 样 的 空子 树 加 入 一 种 特殊 的 项 一 一 占 位 树叶 。 


UJ 
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红 黑 树 是 一 个 折 半 查找 树 ， 它 或 者 为 空 ， 或 者 根 项 着 黑色 ， 而 其 他 的 每 个 项 着 红色 或 黑 
色 ， 并 满足 下 面 的 属性 : 

红色 规则 : 如 果 某 项 着 红色 ， 那 么 它 的 父亲 必须 是 黑色 的 。 

路 径 规则 : 从 根 项 到 没有 子女 或 有 一 个 子女 的 项 的 所 有 路 径 上 的 黑色 项 的 数量 必须 是 相 
同 的 。 

例如 ， 图 10-1 显 示 了 一 个 红 黑 树 ， 其 中 的 项 是 整数 。 观 察 一 下 ， 这 是 一 个 有 着 黑色 根 的 
折 半 查找 树 。 图 中 红色 的 项 均 没 有 红色 的 父 节 点 ， 这 满足 了 红色 规则 。 同 样 ， 在 根 到 没有 子 
女 残 有 一 个 子女 的 项 的 五 条 路 径 上 各 有 两 个 黑色 项 ， 因 此 也 满足 了 路 径 规则 。 换 名 话说 ， 访 

[9] 树 是 一 个 红 黑 树 。 


~ 人 
| LIN. 
2 9 40 50 
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图 10-1 包含 8 个 项 的 红 黑 树 


即使 从 根 到 树叶 的 每 条 路 径 上 包含 相同 数量 的 黑色 项 ， 也 可 能 不 满足 路 径 规 则 | 

图 10-2 中 的 树 就 不 是 一 个 红 黑 树 ， 即 使 它 满足 了 红色 规则 而 且 从 根 到 树叶 的 每 条 路 径 上 
都 包含 相同 数量 的 黑色 项 。 它 违背 了 路 径 规 则 ， 因 为 从 $0 到 80 ( 仅 有 一 个 子女 的 项 ) 的 路 径 
上 只 有 一 个 黑色 项 ， 而 从 50 到 20 的 路 径 上 有 两 个 黑色 项 ， 从 50 到 100 的 路 径 也 是 如 此 。 


50 
20 80 


100 
图 10-2 一 个 不 是 红 黑 树 的 折 半 查找 树 


同样 ， 图 10-3 中 的 树 也 不 是 一 个 红 黑 树 。 因 为 它 违背 了 路 径 规则 ， 例 如 ， 从 70 到 40 ( 仅 
有 一 个 子女 的 项 ) 的 路 径 上 有 三 个 黑色 项 ， 但 是 从 70 到 110 的 路 径 上 有 四 个 黑色 项 。 该 树 是 严 
重 不 平衡 的 : 任何 只 有 两 个 树叶 的 树 的 高 度 必定 和 nn 成 线性 关系 。 

图 10-1 中 的 红 黑 树 是 相当 均匀 平衡 的 ， 但 并 非 每 个 红 黑 树 都 具备 这 样 的 特性 。 例 如 ， 图 
10-4 显 示 了 一 个 左思 下垂 的 红 黑 树 。 很 容易 证 明 它 是 黑色 根 的 折 半 查找 树 ， 并 且 满 足 了 红色 
定理 。 对 路 径 定理 ， 在 从 根 到 没有 子女 或 有 一 个 子女 的 项 的 每 条 路 径 上 都 恰好 有 两 个 黑色 项 ， 
也 就 是 说 ， 这 个 树 是 一 个 红 黑 树 。 但 是 一 个 红 黑 树 不 平衡 的 程度 是 有 限 的 。 例 如 ， 不 能 在 图 
10-4 的 项 10 下 再 荐 挂 任何 项 。 如 果 添 加 一 个 红色 项 ， 那 么 将 不 再 满足 红色 定理 。 如 果 添 加 
个 黑色 项 ， 那 么 路 径 定理 又 将 不 成 立 。 





一 
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图 10-3 一 个 不 是 红 黑 树 的 折 半 查找 树 


图 10-4 一 个 不 是 “均匀 ”平衡 的 红 黑 树 


50 
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”图 10-5 包含 14 个 项 且 具 备 最 大 高 度 5 的 红 黑 树 
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如 有 果 一 个 红 黑 树 是 完全 的 ， 除 了 最 低层 是 红色 的 树叶 而 其 他 所 有 的 项 都 是 黑色 的 ， 那 么 


树 的 高 度 将 是 最 小 的 ， 近 似 为 logzn。 为 了 求 出 对 应 于 给 定 n 的 最 大 高 度 ， 应 当 在 某 条 路 径 上 包 


395 


含 尽 可 能 多 的 红色 项 ， 而 其 他 所 有 项 都 是 黑色 的 。 例 如 ， 图 10-4 显 示 了 一 个 这 样 的 树 ， 图 10- 
5 包含 了 另外 一 人 个。 包含 全 部 红色 项 的 路 径 长 度 将 是 没有 红色 项 的 路 径 长 度 的 两 倍 。 这 些 树 使 
我 们 假设 : 红 黑 树 的 最 大 高 度 小 于 2logzn。 在 10.1.1 节 中 将 证 明 这 个 假设 。 


10.1.1 红 黑 树 的 高 度 


从 红 汰 树 的 几乎 所 有 非 叶 节点 都 有 两 个 子女 来 说 ， 它 是 相当 浓密 的 。 实 际 上 上 ， 如 果 某 个 
项 只 有 一 个 子女， 那么 这 个 项 必定 是 黑色 的 ， 而 它 的 子女 一 定 是 一 个 红色 的 树叶 。 这 种 浓密 
性 使 我 们 相信 红 黑 树 是 平衡 的 ， 也 就 是 说 ， 即 使 在 最 坏 情 况 下 ， 它 的 高 度 也 是 和 n 成 对 数 关系 
的 。 对 比 一 下 折 半 查找 树 ， 它 在 最 坏 情况 下 的 高 度 和 n 成 线性 关系 ! 为 了 证 明 红 黑 树 的 高 度 总 
是 和 nn 成 对 数 关 系 ， 需 要 几 个 初步 结论 。 

1. & BAI 

SELL ARM PF. MR ERRA T 3008 — AF EN TORE LR 
色 项 的 数量 是 相同 的 。 

要 证 明 这 个 声明 ， 先 假设 x 是 一 个 红 黑 树 的 根 ，y 是 一 个 子 树 的 根 。 令 b0 是 x (包括 在 内 ) 





Hy (不 包括 在 内 ) 之 间 的 黑色 项 的 数量 ， 令 bl 是 y (包括 在 内 ) 到 它 的 任意 一 个 没有 子女 或 有 


一 个 子女 的 子孙 (包括 在 内 ) 之 间 的 黑色 项 的 数量 ， 并 令 b2 为 y (包括 在 内 ) 到 它 的 任意 另 一 
个 没有 子女 或 有 一 个 子女 的 子孙 (包括 在 内 ) 之 间 的 黑色 项 的 数量 。 图 10-6 描 述 了 这 个 状况 。 
例如 ， 返 回 图 10-5， 假 设 x 是 50，y 是 131， 而 y 的 两 个 子孙 分 别 是 100 和 135。 那 么 b0=1， 
代表 从 50 到 90 的 路 径 上 黑色 项 的 数量 ; 131 是 不 计算 在 b0 之 内 的 。b1 和 b2 的 值 都 是 2。 — 
一 般 来 说 ， 根 据 整个 树 上 的 路 径 规 则 ， 一 定 有 b0+b1=b0+b2。 这 就 暗示 着 bl=b2。 换 句 话 
说 ， 从 y 到 它 的 任意 没有 子女 或 有 一 个 子女 的 子孙 的 路 径 上 的 黑色 项 数量 都 是 相间 的 ， 


\ 


从 x (包括 在 内 ) Bly (不 包括 在 内 ) 之 间 有 b0 个 黑色 项 


\ 


y 
/ \ 


， 从 y (包括 在 内 ) 到 z2 (包括 在 内 ) 之 间 有 b2 个 黑色 项 





图 10-6 [x 为 根 的 红 黑 树 的 一 部 分 ; y 是 x+ 的 一 个 子孙 ，z1 和 z2 是 任 选 的 y 的 
两 个 没有 子女 或 有 一 个 子女 的 子孙 。 那 么 b0 代 表 了 从 x (包括 在 内 ) 
Bly (不 包括 在 内 ) 的 路 径 上 的 黑色 项 数量 ; b1 和 b2 分 别 代表 从 Yy 

(包括 在 内 ) 到 zl 和 z2 (包括 在 内 ) 的 路 径 上 的 黑色 项 数量 
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图 10-7 一 个 根 的 黑色 高 度 为 3 的 红 黑 树 


现在 已 经 证 明了 声明 1， 可 以 进行 下 面 的 定义 。 令 y 是 红 黑 树 中 的 一 项 ， 那 么 定义 y 的 黑色 
高 度 ( 记 作 bh(y)) A: 

bh(y)= 从 y 到 y 的 任意 一 个 没有 子女 或 有 一 个 子女 的 子孙 的 路 径 上 的 黑色 项 数量 

根据 声明 1 可 知 ， 从 某 一 项 到 它 的 没有 子女 或 有 一 个 子女 的 任何 子孙 的 路 径 上 的 黑色 项 数 
量 必 定 都 是 相同 的 ， 因 此 可 以 定义 黑色 高 度 。 例 如 ， 在 图 10-4 中 ，50 的 黑色 高 度 是 2; 20、30、 
40 和 90 的 黑色 高 度 是 1; 10 的 黑色 高 度 是 0。 图 10-7 显 示 了 一 个 红 黑 树 ， 其 中 60 的 黑色 高 度 是 3， 
而 85 的 黑色 高 度 是 2。 

2. 声明 2 

对 一 个 红 黑 树 的 任意 非 空 子 树 1， 

| |. (ÀD 2n» — 1 


(在 这 个 声明 中 ，mD 代 表 t 中 项 的 数量 ，root(D) 代 表 ; 的 根 项 。) 

这 个 声明 的 证 明 照 例 是 对 1 的 高 度 进行 数学 归纳 。 

基本 情况 | 

fixheight()-0. MAn()=1, MRF AEB WAZ bh(root()) RELL, ane 
红色 的 那么 bh(Groot(D)) 就 等 于 0。 无 论 哪 种 情况 都 有 1 > bh(root(1))。 因 此 

n(t)=1=2!— 1 > 29» — 1 

这 就 证 明了 声明 2 中 的 基本 情况 。 

归纳 情况 mn | | 

令 k 是 任意 非 负 整数 ， 并 假设 对 高 度 小 于 等 于 k 的 任意 子 树 ， 声 明 2 都 成 立 。 邻 ! 是 一 个 高 度 
为 kt1 的 子 树 。 如 果 ! 的 根 有 一 个 子女 ， 那 么 一 定 有 bh(root(D)=1， 因 此 
| | n(f)e1z21- 1229990 — 1 


这 就 完成 了 当 :的 根 只 有 一 个 子女 时 的 归纳 情况 的 证 明 ， 


2 
C^ 


S 
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Gil, :的 根 一 定 有 一 个 左 子女 v1 和 一 个 右 子 女 v2。 如 果 ; 的 根 是 红色 的 ， 那 么 
bh(root(1))=bh(v1)=bh(v2)。 如 果 t 的 根 是 黑色 的 ， 那 么 bh(root(?))=bh(v1)+1 =bh(v2)+1。 在 两 
种 情况 下 ， 都 有 

bh(v1) > bh(root(t))- 1 
及 
bh(v2) > bh(root(t))— 1 

WEA Pe ES EBB DSR, Al ee FAA ATE ie] EA 

n(leftTree(t)) > 2*»«»— ] 

及 

n(rightTree(t)) > 2%? 1 
hie t Lb leftTree(1)#flrightTree(t) r Ji jg e 1. 
整理 所 有 这 些 公 式 ， 可 以 得 到 
n(t) = n(leftTree(t))+n(rightTree(r))+1 
2 2900— ] -2962.— J +] 
> Leho- ] 4 bhroot)- 1+1 
=2* Zehro- ] 


一 今 ph(root ny 1 


这 就 完成 了 当 t 的 根 有 两 个 子女 时 的 归纳 情况 证 明 。 
综 上 所 述 ， 根 据 数 学 归纳 原理 ， 声 明 2 对 所 有 红 黑 树 的 非 空子 树 都 是 成 立 的 。 
最 后 将 证 明 一 个 重要 的 结论 : 红 黑 树 的 高 度 和 n 成 对 数 关系 ， 其 中 n 代 表 树 中 项 的 数量 。 
3. 声明 3 
即使 在 最 坏 情 况 下 ， 红 黑 树 的 高 度 也 和 1 成 对 数 关 系 。 
对 任何 包含 "个 项 的 红 黑 树 ，height(D 和 mn 成 对 数 关 系 。 
为 了 证 明 声 明 3， 令 坦 一 个 红 黑 树 。 根 据 红色 规则 ， 从 根 到 最 远 树叶 的 路 径 上 至 多 有 一 半 
项 可 以 是 红色 的 ， 因 此 至 少 有 一 半 的 项 是 黑色 的 。 也 就 是 说 ， | 
bh(root(t)) > height(7)/2 
根据 声明 2: 
n(t) > 2*»roo— ] 
> Dheight(sy/2 ... 1 
据 此 可 以 得 到 : | 
height(t) < 2log,(n(t)+1) 
XX BEA AR Sheight()O(ogn). WE — X Blog PRÉ A 22D , 
height(7) > log,(n(t)+1)- 1 
所 以 可 推 新 Odiogm) 是 height(0) 的 最 小 上 界 。 换 句 话说，height(D 和 mz 成 对 数 关 系 。 
声明 3 说 明 红 黑 树 不 会 距离 平衡 太 远 。 而 另 一 方面 ， 折 半 查 找 树 在 最 坏 情况 下 ， 比 如 树 是 
一 个 链 的 时 候 ， 高 度 是 成 线性 关系 的 。 
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10.1.2 节 描述 了 惠普 的 rb_tree 类 。 结 果 是 find、insert 和 erase 方 法 即便 在 最 坏 情 况 下 也 只 花 
费 O(logn) 时 间 。 在 标准 模板 库 中 没有 任何 红 黑 树 类 ,但 是 在 该 库 的 任意 一 个 实现 中 都 极 可 能 
包含 一 个 以 rb_tree 类 为 原型 的 红 黑 树 实 例 ， 它 是 set、multiset、map 和 multimap 类 定义 中 的 一 
个 字段 。 


10.1.2 惠普 的 rb_tree 类 


rb_tree 类 中 的 基本 概念 是 键 。 回 忆 在 第 8 章 中 ， 一 个 项 的 键 由 项 与 项 之 间 用 来 比较 的 部 分 
组 成 。 例 如 ， 社 会 保障 号 码 可 以 作为 雇员 项 的 一 个 键 ， 而 学 生 证 号 码 也 可 以 作为 学 生 项 的 一 
个 键 。 

下 面 是 rb_tree 类 定义 的 开头 : 

template <class Key, class Value, class KeyOfValue, class Compare> 


class rb_tree 


{ 

再 花 些 时 间 理 解 一 下 指定 模板 参数 的 行 。class Key 代 表 了 键 的 类 型 。 当 实例 化 一 个 
Tb_tree 对 象 时 ， 就 用 一 个 实际 的 类 替换 虚 类 型 Key。 例 如 ， 如 果 键 是 string 类 型 的 ， 那 么 实例 
的 开头 将 是 

rb_tree<string,...> my_tree; | 

与 Value 模板 参数 对 应 的 模板 变 元 是 树 中 播 入 的 项 的 类 型 。 通 常情 况 下 ， 键 和 值 (value) 的 
类 型 是 相同 的 。 例 如 ， 每 个 值 可 能 是 一 个 汽车 厂商 ， 像 “Ford”， 而 每 个 键 也 是 相同 的 。 因 此 
人 在 树 中 将 存储 “Ford”， 而 当 该 项 和 其 他 项 进行 比较 时 ， 将 比较 键 “Ford” 和 其 他 的 键 。 


下 一 个 模板 参数 KeyOfValue 是 函数 类 类 型 的 。 函 数 类 和 函数 对 象 在 第 9 章 介绍 过 ， 并 在 实 


验 21 中 进行 了 研究 。KeyOfValue 参 数 将 被 一 个 函数 类 取代 ， 在 该 类 中 operatorO 从 值 中 返回 
键 。 假设 key 是 那个 函数 类 中 的 一 个 函数 对 象 ， 而 项 v 是 Value 类 型 的 。 只 有 两 种 情况 是 需要 注 
意 的 : 

1) 键 和 值 是 相同 的 : 在 这 种 情况 里 ，key(v) 只 是 返回 v。 这 个 情况 适用 于 标准 模板 库 中 的 
set 和 multiset 类 , | 

2) v 是 一 个 对 ， 它 的 第 一 个 组 件 是 键 : 这 种 情况 下 key(v) 返 回 v 的 第 一 个 组 件 。 这 种 情况 
运用 于 标准 模板 库 中 的 map 和 multimap 类 。 例 如 ， 假 设 每 个 值 都 由 下 面 的 对 组 成 : 汽车 厂商 和 
总 销售 额 (以 十 亿美 加 计 )。 那 么 键 是 汽车 厂商 ， 而 每 个 对 的 第 二 个 组 件 都 包含 了 该 广 商 的 总 
销售 额 。 例 如 ， 可 能 有 下 面 的 两 个 对 

“Ford”, 14 

“Honda”, 22 


O 文件 <utility> 包 含 了 一 个 模板 结构 pair， 以 及 有 两 个 参数 的 构造 器 : 
template<class T1, class T2> 
struct pair{ 
T1 first; 
T2 second; 
pair (cont T1& x, const T2& y); 
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最 后 一 个 模板 参数 是 Compare ， 这 是 另 一 个 图 数 类 类 型 的 参数 。 一 个 rb_tree 对 象 经 常用 内 
置 图 数 类 less 作 为 第 四 个 模板 变 元 进行 实例 化 。 为 什么 ? 键 通常 都 是 通过 operator< 进 行 比较 
的 。 回 想 一 下 第 9 章 中 ， 在 <function> 中 定义 的 国 数 类 less 采 用 如 下 方式 重 载 了 operator(): 


bool operator()(const T& x, const T& y) const{return x<y;} 


换 句 话说 ， 如 果 less 是 实例 化 rb_tree 对 象 中 的 第 四 个 模板 变 元 ， 那 么 键 将 根据 operator< 
进行 比较 。 为 了 在 一 个 rb_tree 对 象 中 进行 比较 ， 定义 了 一 个 函数 对 象 : 

Compare key_compare; 

因此 如 采 less 是 实例 化 rb_tree 对 象 中 的 第 四 个 模板 变 元 ， 那 么 在 rb_tree 对 象 中 的 消息 

key_compare(x,y) 

将 被 解释 成 

X«y 

rb_tree 中 的 字段 和 list 类 中 的 字段 是 相当 相似 的 。 

rb_tree 类 的 基本 组 成 和 list 类 非常 相似 : 有 节点 以 及 header、free list. buffer_list, 
next_avail 和 last 字 7 段 。 还 有 ，rb_tree 类 用 get_node 和 put_node 方 法 (取代 了 new 和 delete ) 
处 理 它 自身 的 内 存 管理 。 每 个 节点 的 结构 都 反映 了 一 个 红 黑 树 的 特点 。 下 面 是 rb_tree_node 
的 定义 : 


enum color_type = {red, black}: 


struct rb_tree_node 


{ 
color_type color_field; 
rb tree node* parent link; 
rb tree node" left link; 
rb_tree_node” right link; 
Value value field; 


(Fh 


下 面 是 两 个 着 色 约 定 : 

1) header 节 点 着 色 red。 

2) 当 一 个 节点 最 初 被 插入 时 着 色 red; 重新 着 色 时 必须 满足 红色 规则 。 

在 大 多 数 情 况 下 ， 字 段 都 是 通过 如 parent、 color 和 left 之 类 的 函数 而 不 是 直接 进行 访问 的 。 
因此 用 parent(header) 替 换 了 (*header).parent_link 来 返回 对 header 的 parent_link 字 段 的 引用 。 使 
用 这 些 辅助 函数 的 一 个 原因 是 它们 的 定义 封装 了 所 有 分 配 模型 的 细节 ，。 另 一 个 简化 是 允许 将 
NULL 指 针 看 作 是 一 个 指向 普通 rb_tree_node 的 指针 : 它 是 一 个 特殊 的 节点 一 -NIL， 它 的 颜 
色 是 black， 它 的 left 和 right 字 段 是 NULEL ， 而 它 已 的 Parent 字段 至 少 在 初始 情况 下 为 NULL 。 这 
说 明了 使 用 辅助 函数 的 另 一 个 优点 : STEAMUIAER T YU NULLIS SS color(y) 是 否 返 
回 颜 色 black。 

与 AVLTree 类 中 的 find 方 法 相 比 ， rb_tree 类 中 的 find 方 法 的 定义 要 稍微 抽象 些 (用 一 个 函 
数 对 象 从 值 中 获取 键 ) ， 也 更 深奥 些 (使 用 了 逗号 运算 符 和 条 件 运算 符 )。 但 是 基本 的 算法 是 
相同 的 ， 并 且 worstTime(n) 仍 然 和 n 成 对 数 关系 : 








iterator find(const Key& k) 
{ 


rb tree node* y = header; 
rb tree node"* x = root( ); 
while (x {= NIL) 
if ('Key compare(key(x), k)) 
y = x, X = left(x); 
else 
x = right(x); 
iterator j = iterator(y); 
return (j == end( ) || key_compare(k, key(j.node))) ? end( ) : j; 
) 


insert 和 erase 的 方法 定义 比 AVLTree 中 的 相应 方法 稍稍 短 些 ， 但 更 为 复杂 。 在 继续 深入 之 
前 ， 需 要 了 解 insert 和 erase 方 法 的 定义 并 不 是 很 直观 的 。 红 黑 树 最 初 是 在 R.Bayer(1972) 的 论文 
“Symmetric binary B-trees: Data structure and maintenance algorithms” 中 提出 的 。 这 些 被 称 作 
是 “2-3-4 树 ”中 的 插入 和 删除 算法 很 元 长 ， 但 是 整个 的 插入 和 删除 策略 是 很 容易 理解 的 。 在 
L.Guibas 和 R.Sedgewick(1978) 的 论文 “A diochromatic framework for balanced trees” 中 对 这 
些 结构 应 用 红 黑 着 色 时 ， 所 提供 的 方法 更 简短 ， 但 是 更 难 理解 。 


10.1.3 rb_tree 类 中 的 insert 方 法 


标准 模板 库 的 关联 容器 类 的 患 普 实 现 是 基于 红 黑 树 类 的 。 
insert 的 方法 头 是 : 
pair<iterator, bool> insert(const value_type& v) 


在 进入 插入 的 详细 讨论 之 前 ， 有 必要 解释 一 下 返回 类 型 : pair<iterator, bool». 在 标准 模 
板 库 的 惠普 实现 中 ，rb_tree 类 成 为 四 个 关联 容器 类 一 set、multiset、 map 和 multimap 的 基础 。 
在 set 和 map 类 里 ， 插 入 一 个 值 ， 它 的 键 和 容器 中 某 些 已 有 值 的 键 相同 ， 这 是 非法 的 。 但 是 在 
multiset 和 multimap 里 允许 出 现 重复 的 键 。 为 了 区 别 这 些 情况 ，rb_tree 类 中 包含 了 一 个 字段 : 


bool insert_always: 


每 个 rb_tree 构 造 器 都 有 一 个 bool 参 数 always， 它 初始 化 了 insert_always 字 段 。 因 此 set 和 
map 类 构造 它们 的 rb_tree 字 段 时 ， 将 always 参 数 对 应 的 变 元 设置 成 false， 这 样 就 禁止 了 重复 
键 。 而 在 multiset 和 multimap 类 里 ， 该 变 元 设 为 true， 这 样 就 允许 重复 键 。 

当 调 用 rb_tree 类 的 insert 方 法 时 ， 如 果 insert_always 字 段 的 值 是 true 或 者 v 的 键 没 有 重复 
树 中 已 有 的 键 BRAY. 那么 返回 的 对 就 由 一 个 位 于 播 入 值 的 欠 代 器 和 值 true 组 成 。 但 是 如 
朱 insert_always 字 段 的 值 是 false， 而 且 v 的 键 重复 了 树 中 已 有 的 键 ， 就 不 能 插入 v， 这 时 返回 
的 对 由 位 于 给 定 键 原始 值 上 的 迭代 器 和 值 false 组 成 。 

现在 考虑 一 下 如 何 执行 播 入 。 共 需要 五 个 步骤 完成 v 的 插入 : 

1) 创建 一 个 由 x 指向 的 节点 。 | 

2) £x. (指向 的 ) 节点 的 value_field 字 段 中 存储 项 v。 

3) 用 BinSearchTree 风 格 将 节点 作为 一 个 树叶 插入 ， 并 将 x 的 颜色 设置 成 red。 


d 
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4) 需要 时 可 通过 重新 着 色 或 调整 结构 ( 重 构 ) 调整 树 。 

5) 将 根 的 颜色 设置 成 black。 

在 调用 真正 的 骨 二 部 分 _insert ( 它 包 含 了 变 元 x、x 的 父亲 以 及 即将 插入 的 项 ) 之 前 ， 实 
际 上 只 有 步骤 1 和 步骤 2 实现 了 insert 方 法 。 惟 一 需要 仔细 思考 的 是 步骤 4。 首 先 想 了 解 的 是 为 
什么 需要 步骤 4。 假 设 将 20 揪 入 一 个 红 黑 树 ， 完 成 步骤 3 之 后 树 的 状态 如 下 : 


它 违 背 了 红色 规则 ， 因 此 必须 做 些 调整 。 在 这 种 情况 下 ， 可 以 用 一 个 简单 的 解决 方案 : 
将 30 市 点 和 80 古 点 的 颜色 都 从 red 修 改 成 black。 这 就 得 到 如 下 的 红 黑 树 : 


有 时 单纯 调整 颜色 (重新 着 色 ) 是 不 够 的 。 例 如 ， 假 设 在 一 个 红 黑 树 中 插入 25， 树 的 状 
态 如 下 : | 


25 


该 树 违 背 了 红色 规则 ， 因 此 必须 进行 调整 。 只 进行 重新 着 色 能 否 将 它 恢复 成 一 个 红 黑 树 
呢 ? 读者 可 以 自己 实验 -- 下 。 

实际 上 ， 只 通过 重新 着 色 是 不 可 能 将 上 面 的 树 恢 复 成 红 黑 树 的 ， 下 面 解释 一 下 原因 。 因 
为 这 个 树 的 黑色 高 度 是 2， 那 么 项 50、40、30、20 和 25 的 路 径 上 必须 恰好 包含 两 个 黑色 节点 ， 
但 是 因为 根 50 必 须 是 黑色 的 ， 所 以 项 40、30、20、25 的 路 径 上 必须 恰好 有 一 个 黑色 项 。 而 红 
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色 规 则 要 求 四 个 项 的 路 径 上 至 多 包含 两 个 红色 节点 。 但 是 在 一 条 四 个 项 的 路 径 上 不 可 能 只 包 
含 一 个 黑色 项 和 至 多 两 个 红色 项 。 

在 这 样 的 情况 下 ， 必 须 调整 树 的 结构 ， 就 是 对 树 的 某 些 部 分 进行 旋转 。 不 是 狐 立 地 考虑 
这 个 例子 ， 让 我 们 开发 一 个 通用 框架 来 调整 结构 。 

假设 刚刚 执行 了 x 节点 的 插入 。 为 了 简化 后 面 的 讨论 ， 就 把 这 个 证 点 称 作 x 而 不 是 x 指向 的 
市 点 。 需 要 旋转 吗 ? 如 果 x 是 根 ， 那 么 答案 是 “不 需要 ， 因 为 根 的 颜色 将 在 插入 的 第 5$ 步 中 设 
阐 成 black。 相 似 地 ， 如 果 x 的 父亲 是 black， 那 么 也 不 需要 调整 结构 ， 因 为 这 样 并 不 违背 红色 
规则 。 因 此 继续 循环 ， 直 到 满足 下 面 的 条 件 : 

while(x!=root() && color(parent(x))==red) 

实际 上 ， 临 界 因素 是 x 的 父亲 的 兄弟 的 颜色 。 下 面 大 概 描述 一 下 当 x 的 父亲 有 一 个 左 子女 
时 的 情况 一 一 将 “ 左 ” 和 “ 右 ” 翻 过 来 就 可 以 得 到 x 的 父亲 有 一 个 右 子女 时 的 情况 。 令 y 指 向 x 
的 父亲 的 〈 右 ) 兄弟 。 就 把 这 个 兄弟 节点 称 作 y 而 不 是 y 指 向 的 节点 。 需 要 考虑 三 种 情况 。 

情况 1 color(y)=red 

例如 ,假设 在 一 个 红 黑 树 中 插入 40， 相 关 部 分 如 下 : 





50 
30 90 «-——— y 
X ———— 40 

这 时 的 行动 如 下 : 
color(y)=black; 
color(parent(x))=black; 
color(parent(parent(x)))=red; 
x=parent(parent(x)); 
这 样 得 到 的 局 部 树 是 : 

X -一 一 一 一 > S0 

30 90 
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fExx A TR OL ARE Ek PZ ARER. EREA, ARER 
最 大 数量 将 是 树 的 高 度 的 一 半 。 这 也 就 说 明了 之 所 以 rb_tree 类 中 的 insert 方 法 的 worstTime(n) 
和 树 中 项 的 数量 a 成 对 数 关系 的 原因 。 

情况 2 color(y)=black 且 x 是 一 个 右 子女 : 

例如 ， 假 设 将 40 插 入 一 个 红 黑 树 ， 因 而 产生 的 树 如 下 : 


50 


SN, m NIL) 


30 «—— y 


X —— 40 


注意 当 y 为 NULL 时 ，y 就 成 为 一 个 颜色 为 black 的 指向 NIL 的 指针 。 这 时 的 行动 是 : 
x=parent(x); 
rotate_left(x); 


在 这 个 左旋 转 之 后 的 树 是 : 


50 


40 


30 «———— x 


这 样 仍 设 有 结束， 因为 x 和 它 的 父亲 都 是 red， 所 以 产生 了 情况 3。 
情况 3 color(y)=black 日 x 是 一 个 去 子 女 
例如 ， 假 设 将 30 插 入 一 个 红 黑 树 ， 树 的 相关 部 分 如 下 : 


50 
40 «€———— y 


30 «— —— x 








这 时 的 行动 是 : 
color(parent(x))-black; 


color(parent(parent(x)))—red; 
rotate right(parent(parent(x))); 


在 这 个 右 旋转 之 后 的 树 的 局 部 如 下 : 


40 


X————» 30 50 


注意 在 采取 情况 3 规定 的 行动 之 后 ，x 的 父亲 的 颜色 将 总 是 black 的 ， 因 此 将 终止 while 循 
环 的 运行 。 

基本 的 思想 是 : 如 果 情 况 1 不 适用 ， 那 么 就 先 检测 情况 2， 然 后 不 论 情 况 2 是 否 适 用 都 要 应 
用 情况 3。 注 意 在 情况 2 之 后 总 是 要 应 用 情况 3 的 。 下 面 是 全 部 的 组 成 ( 当 x 的 父亲 是 一 个 左 子 
AW): 

if(y 是 redj{/ 情 况 1 


} 
else(//y a black 
if(x 是 一 个 右 子 女 M// 情 况 2 


} 
HBR 3 


) 


如 果 在 任意 一 次 循环 迭代 中 不 能 应 用 情况 1， 那 么 必定 应 用 情况 3 (之 前 可 能 应 用 情况 2)， 
并 且 x 的 父亲 的 颜色 将 被 设置 成 black。 因 此 在 该 选 代 之 后 循环 的 执行 将 终止。 
下 面 是 完整 的 while 循 环 : 


while (x !— root( ) && color(parent(x)) == red) 
if (parent(x) == left(parent(parent(x)))) // 如 果 parent(x) 是 一 个 左 子女 
| 
y = right(parent(parent(x))); 
if (color(y) == red) // 情况 1 
{ | 7 
color(parent(x)) = black; 
color(y) = black; 
color(parent(parent(x))) = red; 
X = parent(parent(x)); 
} 
else // y 的 颜色 必须 是 black 
{ . 


A 
C 
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if (x == right(parent(x))) // 情况 2 
{ 
x = parent(x); rotate left(x); 
} 
/ 情况 3 
color(parent(x)) = black; 
color(parent(parent(x))) = red; 
rotate right(parent(parent(x))); 
j 
} 
else // parent(X) 是 一 个 右 子 女 
{ 
y = left(parent(parent(x))); 
if (color(y) == RED) // 情况 1 
{ 
color(parent(x)) = black; 
color(y) = black; 
color(parent(parent(x))) = red; 
X = parent(parent(x)); 
) 
else // y 的 颜色 必须 是 black 
if (x == left(parent(x))) // 情况 2 
{ 
X = parent(x); rotate right(x); 
) 
/ 情况 3 
color(parent(x)) = black; 
color(parent(parent(x))) = red; 
rotate left(parent(parent(x))); 


} 
基 随 这 个 循环 之 后 是 : 


color(root())=black; 


实验 22 是 一 个 示例 ， 其 中 包含 了 请 求 插 入 一 个 项 时 的 全 部 三 种 情况 。 


| 实验 22: 使 用 全 部 三 种 情况 的 红 黑 树 插入 (所 有 实验 都 是 可 选 的 ) | 


正如 在 10.1.1 节 中 所 证 明 的 ， 任 何 红 黑 树 的 高 度 都 和 树 中 项 的 数量 "成 对 数 关系 。 因 此 在 
将 某 项 作为 树叶 插入 时 ，worstTime(n) 和 nn 成 对 数 关 系 。 那么 执行 While 循 环 时 的 worstTime(n) 
也 和 x 成 对 数 关系 。 综 上 所 述 ， 对 整个 insert 方 法 而 言 ， worstTime(n) 和 nn 成 对 数 关 系 。 


10.1.4 erase 方 法 


在 rb_tree 类 的 研究 的 最 后 ， 考 察 一 下 erase 方 法 的 细节 。 下 面 是 它 的 头 : 
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void erase(iterator position) 

xXx 4r Jj GAL BEBE positionbr FR. "EAS SS AL— HEB JLFIMB UL. Txbix ze Po Bp 
而 不 是 三 种 情况 ， 在 认真 讨论 这 些 情况 之 前 ， 先 做 一 些 准 备 工 作 。 

代码 的 开头 是 相当 简单 的 。 市 点 的 删除 就 像 BinSearchTree 版 本 的 erase 方 法 删除 节点 一 样 。 
读者 要 确保 理解 了 BinSearchTree 类 的 erase 方 法 是 如 何 工作 的 。 例 如 ， 如 果 被 删除 的 节点 只 有 
一 个 子女 ， 那 么 用 该 子女 替换 被 删除 的 节点 。 如 果 被 删除 的 节点 有 两 个 子女 ， 那 么 用 被 删除 
节点 的 直接 后 任 趟 换 它 ”。 一 个 红 黑 树 的 高 度 是 O(logm， 所 以 rb_tree 类 的 erase 方 法 的 这 个 部 
分 在 最 坏 情 况 下 将 耗费 对 数 时 间 。 在 删除 之 后 不 能 直接 停止 ， 因 为 这 时 有 可 能 违背 红色 规则 
和 路 径 规 则 。 

如 果 被 删除 节点 只 有 一 个 子女 ， 那 么 只 需要 再 做 一 点 工作 。 这 是 因为 ， 就 像 在 10.1.1 节 中 
提 到 的 ， 被 删除 节点 必定 是 black ， 而 替换 它 的 节点 必定 是 red。 因 此 将 替换 它 的 节点 的 颜色 设 
置 成 black ， 得 到 的 就 仍然 是 一 个 红 黑 树 。 

如 果 被 删除 节点 是 一 个 树叶 ”只 有 当 被 删除 节点 是 一 个 树叶 或 是 有 两 个 子女 时 才 需 要 做 
更 多 的 工作 。 假 设 被 删除 节点 是 一 个 树叶 。 如 果 该 树叶 是 根 或 是 red， 那 就 不 需要 再 做 什么 。 
否则 ， 令 x 为 〈 指 向) NIL 节 点 (的 指针 )， 用 它 替换 被 删除 的 black 树 叶 ， 并 令 w 是 (指向 ) x 
的 兄弟 石 点 《的 指针 )。 例 如 ， 假 设 要 在 下 面 的 红 黑 树 中 删除 50: 


40 


UN UN 
10 00 — 50 50 


那么 用 一 个 NIL 节 点 林 换 50， 得 到 : 


AN AN 
90 «———— 


根据 路 径 规则 ， 因 为 被 删除 的 节点 不 是 NIL， 所 以 w 不 能 是 (指向 ) NIL (的 指针 )。 那 么 
将 继续 循环 通过 四 种 情况 ， 直 到 开始 是 black 的 x 成 为 根 或 是 red。 

如 果 被 删除 节点 有 两 个 子女 现在 考虑 当 被 删除 节点 有 两 个 子女 的 情况 。 如 果 被 删除 节点 
是 red 并 且 替 换 的 节点 也 是 red， 那 么 得 到 的 仍旧 是 一 个 红 黑 树 。 例 如 ， 如 果 从 图 10-8 所 示 的 红 
黑 树 中 删除 80， 将 得 到 图 10-9 所 示 的 红 黑 树 。 — 

此 外 ， 如 果 被 删除 节点 是 black， 而 禁 换 的 节点 是 red， 那 么 只 需要 将 替换 节点 的 颜色 改 成 
black， 得 到 的 就 仍然 是 一 个 红 黑 树 。 例 如 ， 如 果 从 图 10-9 所 示 的 红 黑 树 中 删除 40， 将 得 到 图 
10-10 所 示 的 红 黑 树 。 因 此 如 果 被 删除 节点 有 两 个 子女 并 且 赫 换 的 节点 是 red， 那 么 只 需要 一 点 


W 


外 “因为 可 能 有 另 一 个 迭代 器 位 于 该 后 任 上 ， 所 以 比 只 是 替换 被 删除 节点 的 代码 要 复杂 些 、 
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图 10-8 即将 从 中 删除 80 的 红 黑 树 


40 
awe 
21 90 
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10 30 60 110 
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图 10-9 从 图 10-8 中 删除 80 之 后 的 红 黑 树 


现在 假设 被 删除 节点 有 两 个 子女 并 且 替 换 的 节点 是 black。 开 始 先 将 被 删除 节点 的 颜色 赋 
巴赫 换 的 节点 。 如 果 赫 换 节 点 有 一 个 非 空 右 子女 ， 那 么 这 个 子女 必定 是 red 的 ， 因 为 殖 换 节点 
不 可 能 有 诺 子 女 。 删 除 时 ， 替 换 节 点 的 右 子 女将 取代 替换 节点 。 然 后 将 这 个 右 子 女 着 色 black ， 
得 到 一 个 红 黑 树 。 

假设 替换 节点 有 一 个 空 的 右 子 女 。 令 x 为 (指向 ) NIL 节 点 (的 指针 )， 它 取代 了 赫 换 节点 。 
令 w 为 (指向 ) x 的 兄弟 〈 的 指针 )。 也 就 是 说 ，w 是 替换 节点 的 兄弟 。 例 如 ， 从 图 10-11 所 未 
的 红 黑 树 中 删除 40 之 后 ， 将 得 到 图 10-12 所 示 的 树 。 注 意 ， 由 于 替换 节点 是 black 的 ， 所 以 路 径 
规则 要 求 w 不 能 是 NIL， 

如 果 x 开 始 是 red， 那 么 所 有 需要 做 的 就 是 将 x 设 成 black ， 然 后 就 满足 了 这 两 个 规则 。 类 似 
地 ， 如 果 x 开 始 是 根 ， 那 么 将 x 设 成 black 就 完成 了 。 惟 - -需要 做 较 多 工作 的 情况 是 当 x 是 一 个 
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black 的 非 根 节 点 时 ， 将 不 断 循环 直到 x 为 red 或 者 x 是 根 市 乓 。 


m 45 
SN 一人、 人 
10 30 60 110 | | 
ÁN ON 
50 70 100 120 


图 10-10 在 图 10-9 中 删除 40 之 后 的 红 黑 树 


40 
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23 90 
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图 10-12 从 图 10-11 中 删除 40 之 后 的 树 


如 果 被 删除 节点 是 一 个 树叶 或 者 有 两 个 子女 如果 被 删除 节点 是 一 个 树叶 ， 那 么 x 是 〈( 指 
向 ) NIL 节 点 (的 指针 )， 它 取代 了 替换 节点 。 如 果 被 删除 节点 有 两 个 子女 ， 那 么 x 是 (指向 ) 
赫 换 节点 的 右 子 女 ( 的 指针)。 在 这 两 种 情况 中 ， 去 掉 被 删除 的 节点 之 后 ，w 都 是 x 的 兄弟 。 
然后 将 继续 循环 ， 直 到 x 是 red 或 者 x 是 根 。 当 x 是 左 子 女 时 共有 四 种 情况 ， 而 当 x 是 右 子女 时 也 
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有 四 个 对 称 的 情况 (只 是 交换 “ 左 ” 和 “ 右 ”)。 和 讨论 插入 时 一 样 ， 这 里 只 介绍 x 是 一 个 左 子 
女 的 情况 。 本 节 的 最 后 将 说 明 全 部 的 八 种 情况 。 

无 论 被 删除 节点 是 一 个 树叶 或 是 有 两 个 子女 ， 都 适用 下 面 的 情况 。 

情况 1 color(w)=red 

这 种 情况 下 采取 的 行动 是 : 

color (w) = black; 

color (parent (x)) = red; 


rotate left( parent (x)); 
w = right (parent (x)); 


例如 ， 假 设 从 下 面 的 树 中 删除 65: 


在 这 个 树 中 ，x 是 (指向) NIL (的 指针 )。 因 为 w 是 red 的 而 且 x 是 一 个 左 子女 ， 所 以 采用 
情况 1。 因 此 将 w 的 颜色 设置 成 black ，x 的 父亲 的 颜色 设置 成 red， 在 x 的 父 节点 处 进行 左旋 转 ， 
并 将 w 设 置 成 x 的 父亲 的 右 子女 : 


CNN 
入 


55 
XXX 一 一 75 4———— Ww 
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这 时 仍然 不 满足 路 径 规则 ， 但 是 有 了 一 个 新 的 着 色 为 black 的 w1 

这 样 情况 1 就 转换 成 了 其 他 三 种 情况 之 一 。 

情况 2 vw 的 子女 是 black 

回想 一 下 ，w 不 能 是 NIL， 而 w 的 一 个 或 两 个 子女 可 能 是 NIL， 但 是 NIL 的 颜色 是 black 
因此 不 需要 专门 区 分 w 的 子女 为 NIL 的 情况 。 无 论 x 是 一 个 右 子 女 或 左 子 女 ， 情况 2 中 采取 的 
行动 是 : 

color(w)=red; 


x=parent(x); 


例如 ， 可 以 在 情况 1 的 范例 最 终 得 到 的 折 半 查找 树 上 应 用 情况 2。 在 该 例子 的 最 后 得 到 了 : 


“^A LN 
入 


55 
X——— 75 4———— w 


因为 w 的 两 个 子女 都 是 black (回忆 NIL 节 点 都 是 black 的 )， 所 以 可 以 应 用 情况 2 得 到 : 


x 15 t—— w 


现在 x 是 red， 因 此 循环 失败 ， 将 x 的 颜色 设置 成 black ， 最 终 得 到 如 下 红 黑 树 ; 


~ 


> 
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迄今 为 止 看 到 的 erase 方 法 中 循环 的 大 体 轮廓 是 : 


while (Xx 不 是 根 且 X 的 颜色 为 black) 
{ 
if (x == X 的 父亲 的 左 子女 ) 
{ 
w = X 的 父亲 的 右 子女 ; 
if (w 的 颜色 是 red) 


TRA... 
] 
if (w 的 子女 都 是 black) 
{ 
. Hate... 
} 
else 
{ 
. 情况 3 和 情况 4 .. . 


} 
else // Xi& —^ ATX 
{ 


} 
) // while 
color (x) = black; 


幸运 的 是 ， 循 环 总 会 在 情况 3 或 情况 4 之 后 终止 。 如 果 适 用 情况 1， 那 么 循环 总 会 在 单 次 迭 
代 之 后 终止 ,除非 处 理 完 情 况 1 之 后 又 应 用 了 情况 2。 情 况 2 是 惟一 需要 另外 的 循环 迭代 的 情况 ， 
而 且 当 应 用 它 时 x 将 更 接近 根 ， 因 此 while 循 环 至 多 执行 Odogm) 次 。 

情况 3 w 的 右 子 女 是 black 

根据 刚刚 给 出 的 erase 方 法 的 轮 廊 ， 很 显然 在 这 种 情况 下 ，w 的 两 个 子女 不 可 能 都 是 black。 
因此 w 的 左 子女 必定 是 red 的 。 这 时 采取 的 行动 如 下 : 

color(left(w))=black: = 

color(w)=red; 

rotate right(w); 

wzright(parent(x)); 


例如 ， 假 设 从 下 面 的 红 黑 树 中 删除 45: 





在 while 循 环 的 开头 有 : 


60 
SIN 70 | 
D> ed 55 65 | 72 
X 
62 68 7] 81 


因为 w 是 black 而 且 w 的 两 个 子女 都 是 black (NIL 节 点 着 色 black ) ， 所 以 采用 情况 2。 应 用 
情况 2 之 后 ， 在 下 一 个 循环 迭代 里 将 得 到 : 


60 


X 70 ——- w 
55 65- 


> 
> 


62 68 zu" 81 


这 时 适用 情况 3 , 因为 w 是 black 的 且 w 的 左 子女 是 red 而 右 子女 是 black。 重新 着 色 ， 右 旋转 
并 重新 设置 w 之 后 得 到 : BE 


x——— 50 - ,| e 65«———w 





68 .72 


乍 看 起 来 这 好 像 没什么 改进 。 但 是 注意 w 的 右 子女 现在 是 red 的 ， 这 将 带 我 们 进入 情况 4 


T 
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情况 4 w 的 右 子女 是 red 
下 面 是 将 采取 的 行动 : 
color (w) = color (parent (x)); 
color (parent (x)) = black; 
color (right (w)) = black; 

left rotate (parent (x)); 
break; // 终止 循环 


例如 ， 假 设 从 下 面 的 红 黑 树 开 始 : 


60 


— cu 
-一 人 一 人 


65 


NOAN 


417] 删除 50 之 后 有 : 
60 
| — c 
一 个 —, A N 
W —* 45 N 72 
68 ÁN 


这 时 通用 情况 2 , 而 且 当 x 是 一 个 右 子女 时 和 x 是 左 子女 时 采取 的 行动 相同 。 因此 将 
coior(w) 设 置 成 red 并 将 x 设 置 成 parent(x)。 在 循环 的 下 一 次 迭代 中 得 到 : 


60 . 











现在 适用 情况 4， 因 此 重新 着 色 并 围绕 x 的 父亲 进行 左旋 转 : 


60 72 
/ N 71 81 
45 68 


这 个 树 同 时 满足 了 红色 规则 和 路 径 规 则 ， 因 此 结束 。 
下 面 这 个 例子 是 情况 4 前 面 是 情况 3 的 情形 ， 假 设 从 情况 3 示例 末尾 的 树 开始 : 


AN 

CA 
71 81 

w 的 右 子 女 是 red， 因 此 适用 情况 4。 重 新 着 色 并 围绕 x 的 父亲 左旋 转 之 后 得 到 : 


65 


\ VAN 


55 71 81 
现在 既 满 足 了 红色 规则 又 满足 了 路 径 规则 ， 因 此 结束 . | 


只 要 应 用 情况 3， 那 么 w 的 右 子女 将 变 成 rrd， 因 此 在 情况 3 之 后 总 是 应 用 情况 4。 比 复制 情 
况 4 的 代码 更 好 的 方法 是 将 该 代码 放 在 情况 3 代码 的 后 面 。 当 x 是 一 个 左 于 女 时 ， 情 况 3 和 情况 4 
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的 大 致 结构 是 : 

if(w 的 右 子 女 是 black) 

{ 

} 

.情况 4... 

任 本 市 开头 提 到 过 ，erase 方 法 的 第 一 部 分 一 一 使 用 了 BinSearchTree 方 式 的 删除 一 一 在 最 
坏 情 况 下 花费 的 时 间 与 4 成 对 数 关系 。 在 while 循 环 中 组 成 了 erase 方 法 的 第 二 部 分 ， 只 有 在 应 
用 情况 2 时 循环 继续 ， 然 后 x 向 根 移动 ， 迭 代 的 最 大 次 数 是 O(logn)。 将 这 两 部 分 合并 在 一 起 ， 
erase 方 法 在 最 坏 情 况 下 花费 的 时 间 和 xz 成 对 数 关系 。 平 均 情 况 下 ， 这 两 个 部 分 各 自 只 花费 常数 
时 间 ， 因 此 averageTime(n) 是 常数 。 实际 上 amortizedTime(n) 也 是 常数 。 

下 面 是 包含 了 x 是 左 子 女 时 四 种 情况 的 完整 while 循 环 ， 以 及 x 是 右 子女 时 的 四 个 对 称 情况 。 





while (x != root( ) && color(x) == black) 
if (x == left(parent(x))) 
{ 


link type w = right(parent(x)); 
if (color(w) == red) // 情况 1 
{ 
color(w) = black; 
color(parent(x)) = red: 
rotate_left(parent(x)): 
w = right(parent(x)); 


If (color(left(w)) == black && color(right(w)) 
mE == black)W 情况 2 

{ 

color(w) = red: 

X = parent(x); 


else 


{ 
if (color(right(w)) = black) / 情况 3 
{ 


color(left(w)) = black: 
color(w) = red; 
rotate_right(w): 

w = right(parent(x)); 


.] 
ERA 
color(w) = color(parent(x)); 
color(parent(x)) = black; 
color(right(w)) = black; 
rotate left(parent(x)); - 
> 2). break; | | 
2H 
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Hf | 
// 与 前 面 的 对 称 ; 交换 " 左 " 和 " 右 " 
// 
link type w — left(parent(x)); 
it (color(w) == red) // 情况 1 
{ 

color(w) = black; 

color(parent(x)) = red; 

rotate_right(parent(x)); 

= left(parent(x)); 

} 
if (color(right(w)) == black && color(left(w)) ==black)/ 情况 2 
{ 

color(w) = red; x = parent(x); 
} 
else 


{ 
if (color(left(w)) == black) // 情况 3 
{ 
color(right(w)) = black; 
color(w) = red; 
rotate_left(w); 
= left(parent(x)); 
} 
// 情况 4 
color(w) = color(parent(x)); 
color(parent(x)) = black; 
color(left(w)) = black; 
rotate right(parent(x)); 
break; 


} 
) // while 循 环 结束 
color(x) = black; 


实验 23 说 明了 在 单 次 erase 方 法 调用 中 是 如 何 应 用 全 部 四 种 情况 的 。 


实验 23: erase 的 调用 ， 其 中 应 用 了 全 部 四 种 情况 。 (所 有 实验 都 是 可 选 的 ) 


10.2 标准 模板 库 的 关联 容器 


下 面 即将 讨论 标准 模板 库 中 的 四 个 关联 容器 类 。 回忆 在 第 8 章 中 ， 关联 容器 是 通过 项 之 间 
键 的 比较 来 确定 项 位 置 的 容器 。 mu 

rb_tree 类 主要 目的 不 是 直接 的 应 用 ， 而 是 作为 标准 模板 库 中 四 个 关联 容器 类 的 典型 实现 
的 基础 。 根 据 对 下 面 两 个 问题 的 四 种 可 能 的 答案 ， 可 以 分 出 四 种 相应 的 数据 结构 : 
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一 个 项 只 由 一 个 键 组 成 吗 ? 
容 絮 允许 多 个 项 使 用 相同 的 键 吗 ? 
下 面 的 表 说 明了 这 些 问 题 的 答案 是 如 何 决定 了 四 种 数据 结构 的 。 





允许 重复 项 吗 ? 
只 由 键 组 成 吗 ? - z 
z " 
是 多 集合 集合 
8 多 映射 映射 


例如 ， 集 合 的 定义 是 一 个 关联 容器 类 ， 其 中 每 个 项 仅 由 一 个 键 组 成 ， 而 且 不 允许 重复 
项 ; 它 的 插入 、 删 除 和 查找 的 worstTime(n) 与 4 成 对 数 关系 。 自 此 以 后 ， 我 们 主要 关心 的 是 这 
四 种 数据 结构 的 可 能 的 实现 。 先 从 set 和 multiset 类 开始 ， 然 后 再 研究 map 和 multimap 类 。 


set 类 
在 标准 C++ 中 ，set 类 声明 的 开头 如 下 : 


template <class Key, class Compare = less<Key>， 
class Ailocator = allocator<Key>> 
class set 


{ 


和 往常 一 样 ， 先 忽略 分 配器 的 工作 。 在 set 类 里 ， 键 就 是 整个 的 项 ， 而 且 键 是 独 一 无 一 的 。 
例如 ， 下 面 是 set 对 象 的 定义 ， 其 中 包含 了 按 词典 顺序 的 字符 串 项 : 


set <string> names; 


因为 集合 是 一 个 关联 容器 ， 它 的 项 是 根据 和 其 他 项 之 间 的 比较 进行 存储 的 。 而 比较 使 用 
的 是 模板 参数 Compare 对 应 的 模板 变 元 ， 这 个 模板 变 元 在 缺 省 情况 下 是 函数 类 less ， 它 在 标准 
模板 库 中 的 <function> 里 的 定义 如 下 : 


template <class T> 
Struct less : binary_function<T, T, bool> { 
bool operator( )(const T& x, const T& y) const { return x < y; } 


}; 

因此 如 果 函 数 对 象 comp 是 函数 类 less 的 一 个 实例 ， 那么 comp(x,y) 将 返回 表达 式 x<y 的 数值 。 
当然 ， 不 使 用 缺 省 情况 ， 也 可 以 指定 除 less 之 外 的 函数 类 一 一 甚至 可 以 指定 用 户 声明 的 函数 类 。 
例如 ， 可 以 定义 一 个 set 对 象 ， 其 中 包含 降序 存储 的 double 类 型 的 项 : 


set<double, greater <double> > salaries: 


在 惠普 的 实现 中 ， 有 一 个 rb_tree 类 型 的 private 字 段 : 


typedef Key key_type; 
typedef Key value_type; , 
typedef Compare key_compare; 
typedef Compare value compare; 
private: 
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typedef rb tree«key type, value type, 
ident«value type, key. type», key compare» rep type; 
rep. type t; // 红 黑 树 表 示 和 集合 


在 ident 国 数 类 中 ，operatorO 获 取 一 个 value_type 类 型 的 变 元 并 简单 的 返回 该 变 元 。 因 此 
是 一 个 rb_tree 的 实例 ， 其 中 键 就 是 整个 值 。 | 

seta E) OB) GERA UJ A fuia. — ATR, begin, end, size, empty, 
find，insert 和 erase。 大 部 分 的 方法 定义 只 不 过 是 让 t 调 用 相应 的 rb_tree 方 法 。 例 如 ，find 和 
erase 的 定义 如 下 : 


iterator find(const key_type& x) const{return t.find(x);} 
void erase(iterator position){t.erase((rep_type::iterator&)position);} 


insert 方 法 是 不 同 的 ， 因 为 如 果 一 个 项 和 set 容 器 中 已 经 存在 的 项 相同 将 不 能 被 插入 。 因 此 ， 
就 像 在 10.1.3 节 中 所 解释 的 ，rb_tree 类 中 的 insert 方 法 必须 返回 一 个 对 : 一 个 迭代 器 和 一 个 
bool 值 。 下 面 是 它 的 定义 ， 还 有 方法 接口 : | 

/后 置 条 件 : 如 果 项 x 已 经 出 现在 集合 中 ， 那 么 返回 的 对 就 由 一 个 位 于 此 插入 项 前 


HI 的 迭代 器 和 false 组 成 。 否 则 ， 返 回 的 对 就 由 一 个 位 于 新 插入 项 的 
// 迭代 器 和 true 组 成 。 


pair<iterator, bool> insert(const value_type& x) 
{ 
pair<iterator, bool> p = t.insert(x); 
return pair<iterator, bool>(p.first, p.second); 


} 
例如 ， 如 果 my_company 是 一 个 雇员 的 set 容 器 ， 那 么 可 以 有 : 


pair<iterator, bool> p = my_company.insert (employee): 
if ('p.second) 
cout << "duplicate item; insertion not made." << endl; 
由 于 find、erase 和 insert 方 法 只 是 调用 它们 的 rb_tree 的 对 应 部 分 ， 所 以 这 三 个 set 方 法 的 
worstTime(n) 都 是 和 n 成 对 数 关 系 。 | | 
下 面 的 程序 将 整数 按照 降序 插入 set 中 ; 并 拒绝 重复 的 整数 : 
#include <iostream> | 


#include <string> 
#include <set> 


using namespace std; 


int main( ) 
{ 


typedef set< int, greater< int > > my: set; 
const int SIZE = 8; 
const string HEADING = "Here are the items in the set:"; 


const string REPEAT = "is already in the set. Insertion rejected."; 


ao 
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const string CLOSE_WINDOW_PROMPT = 
"Please press the Enter key to close this output window.": 


my set S; 
my set::iterator itr; 
int data [SIZE] = { 5, 3, 9, 3, 7, 2, 9, 3}: 


for( int i = 0; i < SIZE; i++ ) 
{ 
pair« my_set::iterator, bool > p = s.insert (data [i]); 
if( 'p.second) 
cout << data[ i] << REPEAT << endl: 
) // tor 


cout << endl << HEADING << endl: 


for( itr = s.begin( ); itr {= s.end( ); itr+ + ) 
cout << 'itr << endl: 
cout << endl << CLOSE WINDOW PROMPT: 
cin.get( ); 
return 0; 
) // main 


输出 是 : 


3 is already in the set. Insertion rejected. 
9 is already in the set. Insertion rejected. e 
3 is already in the set. Insertion rejected. 


Here are the items in the set: 


n 0) 9g! - © 


Please press the Enter key to close this output window. 


当然 ， 在 这 个 程序 中 如 果 确 信 数 组 data 中 所 有 的 项 都 是 独一无二 的 ， 那么 可 以 简单 地 忽略 
返回 值 并 写 为 : 


s.insert(data[i]); 


10.3 集合 应 用 : 再 次 讨论 拼写 检查 器 


9.4 市 中 开发 了 一 个 拼写 检查 器 作为 AVLTree 类 的 应 用 。 做 很 小 的 改动 ， 就 可 以 把 拼写 检 
查 器 程序 改造 成 set 类 的 应 用 。 下 面 是 需要 做 的 工作 : 

1) 在 spellcheck.h 中 ， 将 #include "avi.h" 赫 换 成 ##include «set», 

2) 在 spellcheck.h 中 ， 把 dictionary 和 words 的 定义 里 的 AVLTree 赫 换 成 set， 

3) 在 spellcheck.cpp 中 ， 把 compare() 方 法 里 的 itr 定 义 中 的 AVLTree 和 Iterator 分 别 替换 成 set 


和 iterator。 
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作为 一 个 set 类 应 用 ， 其 时 间 花 费 与 AVLTree 应 用 中 的 是 一 样 的 。 
10.3.1 multiset 类 


在 multiset 容 器 里 ， 每 项 只 由 一 个 键 组 成 而 且 允 许 重复 项 。 为 了 允许 重复 ， 每 个 multiset 构 
造 器 都 在 调用 rb_tree 构 造 器 时 将 true 传 递 给 always。 那 么 rb_tree 对 象 中 的 insert_always 字 段 将 
获得 值 true . 

由 于 在 一 个 multiset 对 象 里 允许 重复 项 ， 所 以 insert 方 法 上 只 是 返回 一 个 位 于 新 插入 项 的 迭代 
三 。 又 因为 一 个 项 可 能 有 多 个 拷贝 ， 所 以 有 一 个 mujtiset 方 法 可 以 返回 位 于 第 一 个 不 破坏 多 集 
合 顺 序 且 能 够 插入 的 位 置 上 的 迭代 器 。 


iterator lower_bound(const T& x) const; 


同样 ，upper_bound 方 法 返回 位 于 最 后 一 个 不 破坏 多 集合 顺序 且 能 够 插入 的 位 置 上 的 迭代 
ao equal range7j ik [ll — 2» 9p T 26 2E PREISE — 1 UG — T XXE RE EUR eR. Rl 
如 ,下面 的 程序 创建 一 个 整数 的 multiset 容 器 并 人 允许 重复 : 


#include <iostream> 


o 


#include <string> 
#include <set> // 声明 集合 和 多 集合 
using namespace std; 


int main( ) 


{ 


typedef multiset< int, less< int > > my. set; 

typedef pair<my_set::iterator, my_set::iterator > Range; 
const int SIZE = 8; 

const string HEADING = "Here are the items in the multiset:": 
const string THREES = "Here are the threes: " ; 


const string CLOSE_PROMPT = 
"Please press the Enter key to close this output window."; 


my_set s; 
int data [SIZE] = { 5, 3, 9, 3, 7, 2, 9, 3}; 
my_set::iterator itr; 


for(int i = 0; i < SIZE; i++ ) 
s.insert (data [i]); 


cout << endi << HEADING << endl: 
for (itr = s.begin( ); itr !— s.end( ); itr+ +) 
cout << "itr << endl; 
cout << endl << THREES << endi; 
Range result = s.equal_range (3); | 
for ( itr = result.first; itr != result.second; itr+ + ) 
cout << *itr << endl; 


cout << endl << CLOSE_PROMPT: 
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cin.get( ); 
return 0; 
) // main 


resuit 变 量 包含 了 一 对 迭代 器 : result.first 位 于 多 集合 中 3 的 第 一 个 实例 ; result. last 位 于 多 
集合 中 3 的 最 后 一 个 实例 随后 的 位 置 。 
实验 24 提 供 了 用 set 和 multiset 类 进行 实验 的 机 会 。 


实验 24: 更 多 与 set 和 multiset 类 相关 的 知识 (所 有 实验 都 是 可 选 的 ) 


本 章 最 后 将 考察 map 和 multimap 类 。 其 中 尤为 重要 的 是 map 类 的 关联 数组 运算 符 -一 一 
operator[]。 它 们 的 特别 之 处 在 于 索引 不 必 是 整数 :索引 可 以 是 一 个 string， 一 个 Employee， 
或 任何 东西 ! 


10.3.2 map 类 


在 标准 C++ 中 ，map 类 声明 的 开头 是 : 


template<class Key, class T, class Compare = less<Key>, 
< Allocator = allocator<T> > 
class map 


{ 


在 map 类 中 ， 每 个 值 都 是 一 个 对 一 一 <Key,T> ， 并 且 不 允许 重复 的 键 。 例 如 ， 定 义 -一 个 称 
作 students 的 map 容 器 ， 其 中 键 是 学 生 的 姓名 (一 个 string )，T 代 表 学 生 的 当前 年 级 平均 分 的 类 
型 ， 并 且 姓 名 按照 字母 顺序 存储 ， 那 么 可 以 写 为 : 


map<string, float,less<string>> students; 


因为 一 个 学 生 在 某 个 给 定时 间 只 能 有 一 个 年 级 平均 分 ， 所 以 map 容 器 students 在 一 个 学 生 
和 他 的 年 级 平均 分 之 间 定 义 了 惟一 的 关联 。 实 际 上 ，students 将 每 个 学 汪 映射 ”到 了 他 的 年 
级 平均 分 上 。 在 map 容 器 students 内 部 将 没有 键 相同 的 对 ， 也 就 是 说 ， "LH THESE VERI. 

和 其 他 的 关联 类 相同 ， 很 多 方法 是 可 用 的 : 各 种 构造 器 ，size， empty, insert, erase, 
find, begin, end- insert 方 法 采用 一 个 值 一 一 即 一 个 对 一 一 作为 它 的 变 元 ; 回忆 一 下 ，pair 
类 的 构造 器 可 以 用 来 初始 化 一 个 “对 ”对 象 。 因 此 可 以 写 为 : 


pair<string,float>student("Stamp,Lisa",3.96): 
students.insert(studenit); 


map 类 有 一 个 非常 优越 的 特色 : 关联 数组 。 在 普通 数组 中 ,索引 是 一 个 整数 。 而 在 关联 数 
组 中 ,索引 是 一 个 键 ， 并 且 键 可 以 是 任意 类 型 的 ， 可 以 是 string 、double、int 类 型 ， 其 至 可 
以 是 一 些 用 户 定义 的 类 。 如 下 赋值 语句 

a[x]2m; 

将 对 <x, m> 插 入 进 映射 a。 如 果 映 射 中 已 经 有 一 个 键 为 x 的 对 会 怎样 ? 那么 赋值 语句 的 作 
用 征 把 那个 对 的 第 二 个 组 件 替 换 成 m。 例 如 ， 前 面向 map 容 器 students 中 进行 了 的 插入 可 以 被 替 
换 成 
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students["Stamp,Lisa"]=3.6; 


为 了 更 好 地 了 解 关联 数组 的 方便 性 ， 考 虑 文本 文件 中 每 个 单词 出 现 的 频率 的 计算 问题 。 
每 个 单词 后 面 可 能 跟着 标点 符号 ， 它 们 不 是 单词 的 一 部 分 。 我 们 将 创建 一 个 映射 其 中 的 每 
个 项 都 是 一 个 对 : 一 个 惟一 的 单词 一 一 键 ， 以 及 文件 中 单词 出 现 的 次 数 。 下 面 是 程序 : 

#include <string> 

#include <ctype.h> // 声明 tolower, isalpha 

#include <fstream> 

#include <map> 

using namespace std; 


typedef map< string, int, less< string >> FrequencyMap; 


int main( ) 
{ 
const string INPUT_PROMPT = 
"Please enter the name of the input file:"; 


const string OUTPUT_PROMPT = 
"Please enter the name of the output file:"; 


const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


FrequencyMap frequencies; 
FrequencyMap: iterator itr; 


string in file name, 
out file name, 
word; 
ifstream in file; 
ofstream out file; 
cout << INPUT. PROMPT << endl: 
cin >> in file name; 
in file.open (in file name.c str( ), ios::in); 


cout << endl << OUTPUT PROMPT << endi; 
cin >> out file name; 
out file.open (out file name.c str( ), ios::out); 


while (in file >> word) 
{ 
/ 使 单词 为 小 写 : 
string temp; 
for (unsigned i = 0; i < word.length( ); i++) 
.. temp += (char)tolower (word [i]); 
word = temp; 


while (!isalpha (word [word.length( ) — 1]) ) 
word.erase (word.length( ) — 1); 
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if (frequencies.find (word ) == frequencies.end( )) 
frequencies [word] = 1; 
else 
frequencies [word]-- +; 
) // while 


for (itr = frequencies.begin( ); itr != frequencies.end( ); itr+ +) 
out file << ("itr).first << " << (‘itr).second << endl; 


cout << endl << endl << CLOSE. WINDOW PROMPT; 
cin.get( ); 
return 0; - 

) // main 


输出 文件 由 < 单词 ， 频 率 > 形 式 的 对 组 成 ， 并 且 单 词 是 按照 字母 顺序 排列 的 。 例 如 ， 假 设 
入 文件 是 : 


This program counts the 

number of occurrences of words in a text. 
The text may have many words 

in it, including big words. 


那么 输出 文件 将 是 : 


a, | 

big, | 
counts, | 
have, 1 

in, 2 
including, 1 
it, 1 

many, 1 
may, | 
number, 1 
occurrences, 1 
of, 2 
program, 1 
text, 2 

the, 2 

this, 1 
words, 3 


map 类 的 任何 实现 都 很 可 能 是 基于 平衡 折 半 查找 树 的。 例如 ， 下 面 给 出 的 是 来 自 惠普 的 实 
Hy: 
private: 


typedef rb tree«key type, value type, 
selectist-value type, key type-, key compare- rep. type; 


rep type t; // 用 红 黑 树 表示 映射 
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就 是 对 <const Key,T>。 对 中 的 第 一 个 组 件 一 键 一 -被 返回 。 因 此 是 一 个 rb_tree 对 象 ， 其 中 
每 个 值 都 是 一 个 对 ， 而 且 对 的 比较 是 根据 每 个 对 的 第 一 个 组 件 进 行 的 。 

从 这 后 讲 ，map 类 中 的 所 有 方法 定义 部 是 单行 的 ， 其 中 t 调 用 对 应 的 rb_tree 方 法 。 其 至 关 
联 数组 运算 符 operator[] 的 定义 也 是 单行 的 : | 

T& operator[ (const key type& k) 


{ 
return (*((insert(value type(k, T( )))first)).second; 


} 


需要 用 一 段 来 解释 这 一 行 。 因 为 value_type 是 pair 类 型 的 ， 所 以 对 参数 k 以 及 T 的 缺 省 构造 
缚 应 用 pair 构 造 器 ;构造 一 个 pair 对 象 。 这 个 pair 对 象 ， 称 作 p， 被 插入 映射 中 。 实 际 上 ， 映 射 
的 insert 方 法 调用 tinsert(p)， 它 将 返回 一 个 迭代 器 - bool 对。 如 果 在 树 中 已 经 有 一 个 值 的 键 是 
k， 那 么 友 代 器 就 位 于 这 个 值 上 。 否 则 ,和 迭代 器 将 位 于 新 插 人 的 <k,TO> 对 上 。 无 论 哪 种 情况 ， 
运 代 器 部 将 脱 引 用 ， 得 到 一 个 值 ， 也 就 是 一 个 <Key,T> 类 型 的 对 。 对 这 个 对 中 第 二 个 组 件 〈T 
类 型 ) 的 引用 被 返回 。 这 个 return 语 句 难以 理解 的 一 个 原因 是 因为 first 代 表 的 是 近 代 器 -bool 
对 的 第 一 个 组 件 ， 而 second 代 表 的 是 Key-T 对 的 第 二 个 组 件 。 

编程 项 目 10.1 是 map 类 的 一 个 应 用 ， 在 第 13 章 和 第 14 章 中 还 将 有 几 个 关联 数组 的 例子 。 为 
了 完整 性 ， 这 里 也 将 介绍 multimap 类 ， 但 它 的 应 用 非常 少 。 


10.3.3 muiltimap 类 


正如 你 所 料 ，multimap 人 允许 有 多 个 键 值 相 同 的 项 ， 而 且 每 个 项 都 是 一 个 对 <Key,T>。 为 了 
避免 多 义 性 ， 这 里 禁止 使 用 关联 数组 : 如 果 一 个 multimap 容 器 myMulti 中 有 对 <"Mark' 3> 和 
«"Mark", S>， 那 么 表达 式 

myMulti["Mark"] 

可 以 引用 任 一 对 的 第 二 个 组 件 。 

下 面 是 一 个 multimap 定 义 的 例子 : 

multimap<int,string,greater<int>> most. wins; 

multimap 容 器 most_wins 将 由 过 去 100 年 中 美国 棒球 协会 中 历年 的 最 大 胜利 次 数 和 得 到 这 
些 胜 利 的 投手 组 成 。 需 要 一 个 multimap 类 ， 因为 胜利 的 比赛 次 数 可 能 存在 重复 。multimap 将 
按照 胜利 次 数 的 降序 排列 。 下 面 是 一 个 插入 示例 : 

most_wins.insert(pair<int,string>(31 , Denny McLain")); 

multimap 类 的 一 个 与 众 不同 的 特点 是 它 的 insert 方 法 包含 一 个 提示 迭代 器 : 

iterator insert(iterator position, const value_type& x); 

和 insert 的 其 他 版 本 一 样 ， 方 法 将 在 树 中 查找 x 归属 的 位 置 。 Xx f d$ position E J£ T JA JD EB 
开始 查找 。 例 如 ， 假设 要 在 多 映射 multi 中 插入 数组 data 里 的 n 个 项 ， 并 假设 data 中 的 那些 项 已 
经 按 正确 顺序 一 一 升序 一 一 排列 了 。 可 以 按 如 下 方式 进行 下 去 : 


itr=multi.begin(); 





A 
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for(int i=0;i<n;i++) 

itrzmulti.insert(itr,data[il); 

(ford Xn I) RED (EP pi insert iz, itr Ge T ERFA. DUI Spe Tc RE 
插入 的 ， 所 以 itr 总 是 位 于 最 大 的 项 上 。 那 么 新 的 项 将 以 常数 时 间 而 不 是 对 数 时 间 插 入 。 插 入 nn 
个 项 的 总 时 间 将 只 是 CCD ， 而 不 是 不 使 用 提示 和 迭代 器 时 的 O(nzlog7m)。 

实际 上 ， 带 提示 的 插入 方法 也 可 以 用 于 set、multiset 和 map 类 ， 但 是 它们 还 具有 其 他 的 


实验 25: 更 多 与 nap 和 multimap 类 相关 的 知识 (所 有 实验 都 是 可 选 的 ) 
总 结 


红 黑 树 是 一 个 折 半 查找 树 ， 它 或 者 为 空 ， 或 者 根 项 着 黑色 、 而 其 他 的 每 个 项 着 红色 或 黑 
色 ， 并 满足 下 面 的 属性 : 

红色 规则 : 如 果 某 项 着 红色 ， 那 么 它 的 父亲 必须 是 黑色 的 。 

路 径 规则 : 从 根 项 到 没有 子女 或 有 一 个 子女 的 项 的 所 有 路 径 上 的 黑色 项 的 数量 必须 是 相 
同 的 。 

红 黑 树 的 高 度 总 是 和 n 成 对 数 关 系 。 

本 章 还 介绍 了 标准 模板 库 中 的 四 个 容器 类 ， 它 们 比较 有 代表 性 的 实现 都 是 基于 红 黑 树 的 。 
这 四 个 类 是 


1) set: value type-key type; 不 允许 重复 。 

2) multiset: value_type=key_type; 允许 重复 。 

3) map: value_type=pair<key_type,T>; 不 人 允许 重复 。 

4) multimap: value_type=pair<key_type,T>; 人 允许 重复 。 
习题 


10.1 写 出 将 下 面 的 数值 插入 一 个 初始 为 空 的 红 黑 树 后 的 结果 : 

30,40,20,90,10,50,70,60,80 - 

10.2 从 习题 10.1 的 红 黑 树 中 删除 20 和 40。 说 明 每 次 删除 之 后 整个 树 的 情况 。 

10.3 构造 一 个 大 小 是 20 而 且 没 有 red 项 的 红 黑 树 是 不 可 能 的 。 解 释 原 因 。 

10.4 任 选 整数 h > 1， 并 按照 如 下 方式 创建 一 个 红 黑 树 : HAL, 2, 3,..., 277. WR, 
2-1, 27-2, .. , 2。 用 h=1 ，2 和 3 分 别 进行 试验 。 最 终 得 到 的 红 黑 树 有 什么 不 寻常 
之 处 ? 

Alexandru Balan 有 助 于 开发 这 个 公式 。 

10.5 假设 v 是 一 个 红 黑 树 中 具有 一 个 树叶 的 项 。 解释 一 下 v 为 什么 必须 是 black， 而 v 的 子 

| 女 必 须 是 一 个 red 树 叶 。 

10.6 构造 一 个 红 黑 树 (忽略 颜色 时 )， 使 它 不 是 一 个 AVL 树 。 

10.7 Guibas 和 Sedgewick(1978) 提 供 了 将 任意 AVL 树 着 色 成 红 黑 树 的 一 个 简单 的 算法 : 对 
AVL 树 中 的 每 一 项 ， 如 果 以 该 项 为 根 的 子 树 高 度 是 一 个 偶 整 数 并 且 以 它 的 父亲 为 根 
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的 子 树 高 度 是 奇数 ， 那 么 将 该 项 着 色 red; 否则 ， 着 色 black。 
例如 ， 考 虑 下 面 的 AVL 树 : 
50 


20 


/ 4^ 


100 


9] 103 


在 这 个 树 中 ，20 的 子 树 高 度 是 1，80 的 子 树 高 度 是 2，10 的 子 树 高 度 是 0，70 的 了 
树 高 度 是 0。 注 意 因为 整个 树 的 根 没有 父亲 ， 所 以 这 个 算法 保证 了 根 将 着 色 black。 下 
面 是 这 个 AVL 树 着 色 后 得 到 的 红 黑 树 : 


1 


20 |. 80 


用 最 小 的 4 个 项 创建 一 个 高 度 为 4 的 AVL 树 ， 然后 将 该 树 着 色 成 一 个 红 黑 树 。 
10.8 假设 在 红 黑 树 定义 中 把 路 径 规则 替换 成 如 下 形式 : 
路 径 规 则 2: 所 有 从 根 项 到 树叶 的 路 径 上 的 黑色 项 数量 必须 相同 。 
a. 找 出 一 个 包含 n 个 项 的 (采用 这 个 新 定义 的 ) 红 黑 树 ， 它 的 高 度 和 n 成 线性 关系 。 
b. 找 出 一 个 折 半 查找 树 ， 它 不 能 着 色 成 红 黑 树 (即使 使 用 这 个 新 定义 )。 
10.9 在 BinSearchTree 类 中 Iterator% 69 Ej 减 方 法 operator--() 需 要 tree_node 结 构 包 念 一 
个 isHeader 字 段 : | 
Iterator& operator-- ( ) 


{ 
if (link -> isHeader) 
link = link -> right; / 返回 最 右边 的 


在 Tb_tree 类 中 ，rb_tree_node 结 构 没 有 isHeader 字 段 。 那么 用 什么 代码 代替 条 件 
jink->isHeader 呢 ? 
10.10 假设 已 知 一 个 公司 里 每 个 雇员 的 姓名 和 部 门 号 。 没 有 重复 的 姓名 ， 并 希望 根据 姓名 
的 字母 顺序 存储 这 些 信息 。 例 如 ， 部 分 输入 可 能 如 下 所 示 : 
Misino,John 8 
Nguyen,Viet 14 
Panchenko,Eric 6 | 


~ 
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Dunn,Michael 6 
Deusenbery,Amanda 14 
Taoubina, Xenia 6 
而 我 们 希望 按照 下 面 的 顺序 存储 这 些 项 : 
Deusenbery,Amanda 14 
Dunn,Michael 6 
Misino,John 8 
Nguyen, Viet 14 
Panchenko,Eric 6 
Taoubina,Xenia 6 
解决 这 个 问题 应 当 使 用 set、multiset、map 或 multimap? 
10.11 重 做 习题 10.10， 不 过 现在 要 求 按照 部 门 号 码 升 序 排列 ， 而 且 在 每 个 部 门 号 内 部 按 
照 姓名 的 字母 顺序 排列 。 例 如 ， 部 分 输入 可 能 如 下 : 
Misino,John 8 
Nguyen, Viet 14 
Panchenko,Eric 6 
Dunn,Michael 6 
Deusenbery, Amanda 14 
Taoubina, Xenia 6 
而 我 们 希望 按照 下 面 的 顺序 存储 这 些 项 : 
.Dunn,Michael 6 
Panchenko,Eric 6 
Taoubina, Xenia 6 
Misino,John 8 
Deusenbery,Amanda 14 
Nguyen, Viet 14 
解决 这 个 问题 应 当 使 用 set、mnultiset、 mapzk multimap? 
10.12 假设 有 | 
map<string, int» my map; 
解释 
my map.insert("Ford",20000); 
和 
my_map["Ford"]=20000; 
之 间 的 区 别 。 
提示 如 果 “Ford” 已 经 作为 my_map 中 某 个 值 的 键 出 现 过 会 怎样 ? 


10.13 对 下 面 的 每 个 类 型 ， 构 造 一 个 适用 它 的 对 象 并 解释 为 什么 该 类 型 适合 这 个 对 象 。 


set< double, greater< double> > 
multiset<string> 

map< double, string> 

muitimap< int, double, greater<int> > 








编程 项 目 10.1: 一 个 简单 的 辞典 
缮 典 是 一 个 同义词 字典 。 例 如 ， 这 里 是 一 个 小 辞典 ， 每 个 单词 后 面 跟着 它 的 同义词 : 


close near confined 
confined cramped 
correct true 
cramped confined 
near close 

one singular unique 
singular one unique 
true correct 


unique singular one 


需要 解决 的 问题 是 : 给 定 一 个 辞典 文件 以 及 从 键盘 输入 的 单词 ， 输 出 键入 的 每 个 单词 的 
同义词 。 

分 析 

酝 典 文件 将 是 按照 字母 顺序 排列 的 。 对 键入 的 每 个 单词 ， 如 果 该 单词 的 同义词 在 辞典 文 
件 中 就 显示 它 的 同义词 。 否 则 ， 将 显示 一 条 错误 消息 。 

系统 测试 (输入 用 黑体 表示 ) 辞典 文件 同上 。 

Please enter a word; the sentinel is *** | 
one | | 


Here are the synonyms: 
singular unique 


In the Input line, please enter a word; the sentinel is *** 
two 
The word is not in the thesaurus. 


Please enter a word; the sentinel is *** 
close | 

Here are the synonyms: 

near 

confined 


Please enter a word; the sentinel is *** 
kik 


编程 项 目 10.2: 创建 一 个 词汇 索引 


给 出 一 个 文本 ， 为 文本 中 的 每 个 单词 开发 一 个 词汇 索引 。 词 汇 索 引 由 文本 中 的 每 个 单词 
和 该 单词 每 次 出 现 的 行 号 组 成 。 包 括 对 所 有 方法 的 大 0 时 间 估 算 。 

分 析 

1) 输入 的 第 一 行将 包含 到 文本 文件 的 路 径 ， 输 入 的 第 二 行 包 含 到 输出 文件 的 路 径 。 

2) 文本 中 的 每 个 单词 只 由 字母 组 成 一 -部 分 或 全 部 单词 可 以 是 大 写 的 ， 

3) 文本 中 的 每 个 单词 后 面 跟着 0 个 或 更 多 标点 符号 ， 随 后 是 任意 数量 的 空格 和 行 尾 标 志 。 

4) 输出 由 小 写 且 按 字母 顺序 排列 的 单词 组 成 ; 每 个 单词 后 面 跟着 它 每 次 出 现 的 行 号 。 行 
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号 之 间 应 当 以 逗号 分 隔 。 


437 


5) 文本 将 装 入 内 存 。 
6) 文本 中 的 行 号 从 1 开始 。 


7) 这 个 项 目 必 须 使 用 映射 来 构造 词汇 索引 。 在 试验 25 中 使 用 了 多 映射 。 


假设 docl.in 包 含 下面 的 文本 : 


. This program counts the 
number of words in a text. 
The text may have many words 


in it,including big words. 


另外 ， 假 设 doc2.in 包 含 下 面 的 文本 : 


Fuzzy Wuzzy was a bear. 
Fuzzy Wuzzy had no hair. 
Fuzzy Wuzzy was not fuzzy. 
Was he? 


EX r2 


In the Input line, please enter the path to the text file. 
doc1.in 


In the Input line, please enter the path to the output file. 
doc1.out 


下 面 是 程序 完成 后 后 docl.out 的 内 容 。 
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第 11 章 “优先 队列 和 堆 


本 章 的 中 心 是 优先 队列 数据 结构 。 优 先 队 列 是 一 个 容器 ， 根 据 一 定 方式 为 项 分 配 优先 级 ， 
其 中 只 有 优先 级 最 高 的 项 才能 被 访问 和 删除 。 有 趣 的 是 ， 优 先 队 列 的 这 个 限制 使 得 在 平均 情 
况 下 插入 只 花费 常数 时 间 ， 即 使 在 最 坏 情 况 下 ， 删 除 也 只 花费 对 数 时 间 。 在 提供 
priority_queue 类 的 方法 接口 之 后 将 描述 标准 C++ 的 实现 。 

因为 priority_queue 类 是 一 个 容器 配 接 器 ， 所 以 类 的 实现 看 起 来 可 能 是 相当 简单 的 ， 就 像 
第 7 章 中 的 queue 和 stack 类 的 实现 一 样 。 但 并 非 如 此 ， 我 们 将 需要 两 个 通用 型 算法 一 一 
push_heap 和 pop_heap， 这 就 带 来 了 有 关 堆 的 探讨 。 堆 是 一 个 完全 二 又 树 ， 其 中 的 每 个 项 都 大 
于 等 于 它 的 子女 。 最 后 将 开发 一 个 优先 队列 在 数据 压缩 领域 内 的 应 用 。 特 别 是 ， 震 夫 有 曼 树 将 
信息 编码 成 压缩 的 形式 以 节约 信息 传送 的 时 间 。 
目标 

1) 定义 优先 队列 。 

2) 理解 push_heap、pop_heap 和 和 make_heap 的 堆 操 作 。 


3) 比较 各 种 优先 队列 数据 结构 的 不 同 实现 的 平衡 折 中 。 
4) 能 够 用 霍 夫 曼 算法 进行 数据 压缩 。 





5) 确定 贪心 算法 的 特性 。 
11.1 介绍 
队列 的 变 体 一 一 优先 队列 ， 是 一 个 普通 的 结构 ， 它 的 基本 思想 是 让 项 排队 等 候 服务 。 选 择 


的 依据 并 非 严 格 遵循 先 来 先 服务 机 制 。 例 如 ， 病 房 中 的 病人 是 根据 受伤 严重 程度 而 不 是 他 们 
的 到 达 时 间 来 对 待 的 。 同 理 ， 在 航运 管理 中 ,往往 有 一 队 飞 机 等 竺 着陆， 但 是 如 果 某 架 飞 机 
缺 油 或 是 载 有 生病 的 乘客 ， 那 么 管理 者 可 以 将 它 移 到 队列 的 前 面 。 

网 络 上 的 共享 打印 机 是 适合 使 用 优先 队列 的 另 一 个 例子 。 正 常情 况 下 ， 各 个 任务 按照 到 
达 时 间 进 行 打印 ， 但 是 一 旦 某 一 任务 正在 打印 ， 那 么 其 他 的 几 个 任务 将 进入 服务 队列 。 最 高 
优先 级 将 被 赋予 打印 页 数 最 少 的 任务 ， 这 将 优化 完成 任务 的 平均 时 间 。 同 样 ， 按 优先 级 别 服 
务 的 观点 适用 于 任何 共享 资源 : 中 央 处 理 器 ， 家 用 汽车 ， 下 一 学 期 提供 的 课程 ， 等 等 。 

下 面 是 它 的 定义 : | 

优先 队列 是 一 个 容器 ， 根 据 一 定 方式 为 项 分 配 优 先 级 ， 其 中 只 有 优先 级 最 高 的 

项 才能 被 访问 和 删除 。 

例如 ,假设 项 是 整数 ， 而 且 当 i 疙 jj 时， 整数 让 jy 具有 更 高 的 优先 级 ; 那么 最 大 的 项 就 具备 最 
高 的 优先 级 。 这 个 定义 没有 明确 说 明 在 哪里 进行 插入 。 明 了 项 的 插入 位 置 是 优先 队列 开发 者 
的 职责 ， 而 不 是 优先 队列 用 户 的 职责 。 

优先 队列 是 公平 的 ， 如 果 在 优先 队列 中 有 两 项 的 优先 级 别 相同 ， 那 么 在 队列 中 滞留 时 间 
长 的 项 将 先 从 队列 中 删除 。 
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如 朱 有 两 个 或 更 多 的 项 都 是 最 高 优先 级 会 怎样 ? 为 了 公平 起 见 ， 这 个 约束 应 当 有 利于 在 
优先 队列 中 请 留 时 间 最 长 的 项 。 这 个 公平 性 的 请 求 不 是 定义 的 一 部 分 ， 也 不 是 priority_queue 
类 的 一 部 分 。 实 际 上 ， 就 像 即 将 在 试验 26 中 看 到 的 ， 在 priority_queue 类 的 标准 实现 中 这 些 约 
束 并 没有 被 公平 地 处 理 。 试 验 26 提 供 了 对 这 个 问题 的 解答 。 

本 章 主 要 致力 于 优先 队列 的 一 个 首要 的 应 用 : 起 夫 曼 编码 。 在 第 14 章 中 ， 优 先 队 列 被 用 
于 两 个 图 算法 中 : Prim 的 最 小 生成 树 算法 和 Dijkstra 的 最 短路 算法 。 要 进一步 探讨 优先 队列 的 
多 功能 性 ， 请 参阅 Dale(1990)。 

11.1.1 市 中 通过 提供 priority_queue 类 中 方法 的 方法 接口 来 定义 该 类 。 


11.1.1 priority_queuezs 


priority_queue 类 声明 的 开头 如 下 : 


template<class T, class Container = vector<T>, 
class Compare = less<Container::value_type> > 
class priority_queue 
{ 
priority queue X £—4 ¥ 23 #4 B 
第 一 个 模板 参数 T 是 优先 队列 中 存储 的 项 的 类 型 .Container 模 板 参数 代表 的 是 基础 容器 类 ， 
它 的 方法 接口 与 priority_queue 类 相配 接 。 相 应 模板 变 元 类 的 要 求 是 要 包含 方法 front、 
push_back 和 pop_back， 并 且 支 持 随机 访问 和 迭代 器 。vector 或 deque 类 满足 了 这 些 要 求 ， 而 且 缺 
省 类 是 vector 类 。 (为 什么 不 能 采用 list 类 ? ) 和 Compare 参 数 对 应 的 模板 变 元 必须 是 一 个 国 数 
类 ， 它 的 operator(0 对 value_type 进 行 比较 ， 这 和 作为 T 几 乎 完全 相同 。 缺 省 变 元 是 内 置 函数 
类 less ， 因 此 值 最 大 的 项 将 放 在 priority_queue 对 象 的 前 面 。 
缺 省 情况 下 优先 级 最 高 的 项 就 是 值 最 大 的 项 。 
在 priority_queue 类 中 只 有 七 个 方法 。 下 面 是 方法 接口 : 
1. RERE: 用 x 和 一 个 容器 对 象 的 拷贝 初始 化 这 个 优先 队列 ， 
explicit priority_queue(const Compare& x=Compare(), 
const Container&-Container()); 


例 可 以 定义 两 个 优先 队列 如 下 : 


pq<employee> e pqi(); © 
pq«employee» e pq2(e pqi)//e pq2& & 7e pqi&g—^ 3&9, 


IBN SUE: 通过 Compare 对 象 x 和 基础 容器 对 象 y， 这 个 优先 队列 被 初始 化 为 
// 从 位 置 first (包括 在 内 ) Blast (不 包括 在 内 ) 之 间 的 项 的 拷贝 ， 
template<class Inputiterator- 
priority queue(Inputlterator first, Inputiterator last, 

const Compare& x=Compare(), 
const Container& y-Container()); 


. /后 置 条 件 : 返回 这 个 优先 队列 中 项 的 数量 。 


size_type size() const; 


4. 1/ 后 置 条 件 : 如 果 这 个 优先 队列 中 没有 项 ， 那 么 返回 真 . ENE EVR. 
bool empty() const; 


ho 
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BREE: x 被 插入 到 这 个 优先 队列 中 。averageTime(n) 是 常数 ,而 


// worstTime(n) #O(n), 
void push(const value_type& x); 


. // 前 置 条 件 : 这 个 优先 队列 非 空 。 


// 后 是 条 件 : 发 送 这 个 消息 之 前 队列 中 优先 级 别 最 高 的 项 被 删除 。worstTime(n) 是 
if O(logn), 
void pop(); 


.// 前 置 条 件 : 这 个 优先 队列 非 空 。 


MARE: 返回 对 这 个 队列 中 优先 级 别 最 高 的 项 的 常量 引用 ，。 


const value type& top() const; 


注意 ”因为 Const 是 返回 类 型 规格 说 明 的 一 部 分 ， 所 以 修改 priority_queue 对 和 象 的 顶部 
项 是 非法 的 。 这 样 的 修改 可 以 改变 顶部 项 的 优先 级 。 


下 面 的 小 程序 创建 并 维护 了 两 个 优先 队列 ， 一 个 是 字母 顺序 的 String 项 ， 另 一 个 是 递减 顺 


序 的 int 项 。 


#include <vector> 

#include <queue> // 定义 priority queue 类 
#include <iostream> | 

#include <string> 


using namespace std; 


int main( ) 


{ 


const string WORDS = "Here are the words in alphabetical order:"; 
const string SCORES = “Here are the scores in descending order:"; 


const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


priority queue«string, vector« string, greater «string. > words; 
priority queue «int scores; // 使 Riíj ds 83988 — 3088 — 7 
NE 模 板 变 元 


words.push ("yes"); 
words.push ("no"); 
words.push ("maybe"); 
words.push ("wow"); 


cout « «WORDS <<endl: 
while (!words.empty( )) 

[ | 
cout « «words.top( ) « «endl; 
words.pop( ); 

) // 显示 并 弹出 单词 

scores.push (50); 

scores.push (71); 

scores.push (65); 
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scores.push (57); 
scores.push (60); 


cout « «end! « «endl « «SCORES <<endl; 
while (!scores.empty( )) 


{ 


cout <<gcores.top( ) <<endl; 
scores.pop( ); 
}W 显示 并 弹出 分 数 
cout « «endl <<endl <<CLOSE_WINDOW_PROMPT;: 
cin.get( ); 
return 0; 
) // main 


输出 是 : 


Here are the words in alphabetical order: 
maybe 
no 


Here are the scores in descending order: 
71 
65 
60 
57 
50 


Please press the Enter key to close this output window. 


现在 将 注意 力 重 新 转 到 priority_queue 类 的 字段 和 实现 上 。 通 过 配 接 另 一 个 容器 类 的 方法 
接口 可 以 大 大 简化 工作 。 但 是 困难 的 工作 是 将 一 种 新 型 的 树 结构 ， 称 作 堆 ， 用 于 像 向 量 或 双 
端 队列 之 类 的 基于 数组 的 容器 。 


11.1.2. priority_queue 类 的 字段 和 实现 


吏 像 queue 和 stack 类 一 样 ，priority_queue 类 的 方法 定义 是 标准 C++ 的 一 部 分 。 根据 标准 
C++，Ppriority_queue 类 的 定义 是 在 <queue> (所 指示 的 文件 ) 中 ， 但 是 对 于 惠普 的 实现 ， 该 定 
义 是 在 <stack> (所 指示 的 文件 ) H. 

priority_queue 类 里 的 两 个 字段 分 别 是 一 个 容器 对 象 c 和 一 个 函数 对 象 comp: 

protected: 


Container c; 
Compare comp; 


缺 省 情况 下 、 容 器 c 将 是 vector 类 的 一 个 实例 。 函数 对 象 comp 将 实例 化 某 些 内 置 或 用 户 定 
义 的 图 数 类 ， 缺 省 情况 下 是 less 类 。 


和 读者 所 想 的 一 致 ，top() 方 法 将 返回 c.front() 所 返回 的 引用 ， 但 是 让 人 困惑 的 是 popO 〇 方法 





调用 了 c.pop_back(O 来 删除 优先 级 最 高 的 项 。 那 么 该 项 是 在 前 面 还 是 后 面 呢 ? 当 看 到 pop(O 方 法 
定义 ?时 更 加 深 了 这 个 谜团 : 
void pop( ) 
{ 
pop heap (c.begin( ), c.end( ) comp); 
C.pop  back( ); 
) // pop 


因此 实际 上 是 一 个 pop_heap 通 用 型 算法 9 在 幕后 控制 着 容器 c。 随 后 对 pop_back 方 法 的 调 
用 再 完成 最 后 的 任务 。 在 Pop_heap 方 法 里 完成 了 pop 方 法 的 比较 困难 的 工作 。 同 样 ，push 方 法 
的 代码 是 : 
void push (const value_type& x) 
{ 
c.push back(x); 


push heap(c.begin( ), c.end( ), comp); 
) // push 


1X HUE A] HES J. u8 FA RPK push_heap#flpop_heap{# FA f ME, (HAA t AE HEN? 
11.1.3 节 中 将 揭示 这 些 内 容 。 | 


11.1.3 ME 


堆 的 递归 定义 。 

堆 : 是 这 样 一 个 完全 二 又 树 ， 它 或 者 为 空 ， 或 者 满足 : 

D 根据 项 之 间 的 某 些 比较 方法 ， 根 项 是 t 中 最 大 的 项 。 

.2) leftTree(t)#frightTree(t) HEHE. 

图 11-1 显 示 了 一 个 包含 10 个 int 项 的 堆 。 

堆 中 的 顺序 是 自 顶 向 下 的 ， 但 不 是 自 左 向 右 的 。 | 

推 中 的 顺序 是 自 顶 向 下 的 ， 但 不 是 自 左 向 右 的 : 每 个 根 项 都 大 于 等 于 它 的 每 个 子女 ， 但 
是 有 些 左 兄弟 大 于 它们 的 右 兄弟 ， 而 有 些 则 小 于 它们 的 右 兄弟 。 例 如 在 图 11-1 中 ，85 比 它 的 
右 兄弟 48 大 ， 但 是 30 就 小 于 它 的 右 兄弟 36。 

107 


人 


Jn /\ 
ÁN / 
26 32 50 


图 11-1 包含 10 个 int 项 的 堆 


O 从 技术 上 上 说， 标准 只 是 规定 了 定义 得 到 的 结果 必须 和 定义 中 说 明 的 结果 -- 致 。 
O 在 惠普 实现 的 <heap> 里 对 这 个 算法 进行 了 定义 ， 但 是 在 标准 C++ 中 是 在 <algorithm> 里 定义 的 。 
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堆 是 一 个 奇怪 的 结构 ， 但 是 它 在 多 种 应 用 中 却 很 有 用 。 当 然 ， 其 中 一 种 就 是 
priority_queue 类 的 实现 。 我 们 将 关注 两 个 主要 的 堆 操 作 一 一 push_heap 和 pop_heap。 另 外 还 将 
提 及 另 一 个 操作 一 一 make_heap ， 它 从 头 创建 一 个 堆 ， 在 调用 priority_queue 构 造 器 时 将 调用 该 
操作 。 在 第 12 章 中 还 将 看 到 第 四 个 也 是 最 后 一 个 堆 操 作 一 一 sort_heap， 它 的 主要 作用 是 将 一 
个 堆 创 建成 一 个 排序 容器 。 

堆 足 一 个 完全 二 又 树 。 正 如 在 第 8 章 中 看 到 的 ， 对 于 完全 三 又 树 中 的 每 一 项 ， 都 可 以 为 它 
关联 一 个 0..na(0- 1 之 间 的 位 置 。 如 果 将 这 些 位 置 看 作 索 引 ， 那 么 堆 中 的 项 就 可 以 存储 在 - -个 
数组 中 。 例 如 ， 下 面 是 图 11-1 所 示 的 堆 的 数组 表示 : 


FEFEFE EEE 

JETT 3,44 B8 dz Elik X R 2 3$ — de cin. 6) E AU AS FI ACE VLA 8 — 4f, 

数组 的 随机 访问 特点 便于 堆 的 处 理 : 给 定 某 一 项 的 索引 ， 就 可 以 快速 地 访问 该 项 的 子女 。 
例如 ， 索 引 i 处 项 的 子女 位 于 索引 2i+1 和 2i+2， 而 索引 j 处 项 的 父亲 位 于 索引 OG- 1)/2。 不 久 将 看 
到 ， 堆 可 以 快速 地 从 父亲 移动 到 它 的 子女 的 位 置 上 ， 反 之 亦 然 ， 这 个 能 力 使 得 堆 成 为 实现 优 
先 队 列 的 一 个 有 效 的 存储 结构 。push_heap 方 法 的 接口 是 : 

// 前 置 条 件 : 从 first {包括 在 内 ) 到 last-1 (不 包括 在 内 ) 之 间 的 项 是 一 个 堆 . 

I STE: 位 于 last-1 上 的 值 被 插入 到 堆 中 。 

template<class RandomAccesslterator, class Compare» 

inline void push heap(RandomAccesslterator first, 

RandomAccesslterator last, Compare comp); 

即将 插入 的 项 ， 也 就 是 last- 1 位 置 上 的 项 ， 被 存储 在 临时 变量 value 中 ， 而 腾 出 的 位 置 
(其 中 仍然 包含 着 即将 插入 的 项 ) 被 称 作 是 陷阱 。 从 技术 的 角度 讲 ， 使 用 了 变量 holeIndex:， 它 
包含 了 当前 陷阱 在 容器 中 的 索引 。 例 如 ， 图 11-2 显 示 了 在 调用 push_heap 方 法 插入 90 时 图 11-1 
中 堆 的 变化 。 

要 了 解 当 90 存 储 在 陷阱 中 时 是 否 需 要 维护 堆 ， 将 90 和 陷阱 父亲 一 一 索引 为 (hole_index- 1)/2 
上 的 项 55 进 行 比较 。 因 为 90>55， 所 以 将 55 移 动 到 陷阱 处 并 把 holelndex 移 动 到 5 原先 的 位 置 
上 ,参阅 图 11-3。 继 续 循 环 ， 直 到 到 达 堆 的 顶部 或 是 找到 一 个 位 置 使 得 90 < 陷阱 父亲 上 的 项 。 
然后 将 90 插 入 陷阱 所 在 的 位 置 ， 最 后 得 到 的 堆 如 图 11-4 所 示 。 
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图 11-2 push_heap 方 法 开始 时 图 11-1 中 的 堆 。 即 将 被 插入 的 项 是 90 
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图 11-3 对 图 11-2 中 使 用 push_heap 方 法 将 90 和 55 比 较 之 后 的 堆 


一 
90 36 
/\ /\ value 


图 11-4 在 图 11-1 中 调用 push_heap 方 法 插入 90 之 后 的 堆 
下 面 是 _push_heap 方 法 中 最 基本 的 代码 (把 Distance 看 作 是 int 的 同 义 字 ): 


Distance parent = (hoieindex — 1) / 2; 
while (holelndex > toplndex && comp (*(first + parent), value)) 
{ 
"(first + holelndex) = *(first + parent); 
holeindex = parent; 
parent — (holelndex — 1) / 2; 
) // while | 
*(first + holelndex) = value; 


在 最 坏 情 况 下 ， 将 要 被 插入 的 项 大 于 first 位 置 上 的 项 。 这 时 while 循 环 的 迭代 次 数 与 树 的 
高 度 成 正比 。 而 完全 二 又 树 的 高 度 和 n 成 对 数 关系 (见习 题 8.7)。 也 就 是 说 ，worstTime(n) 和 in 

在 平均 情况 下 ， 堆 中 大 约 有 一 半 的 项 比 即 将 插入 的 项 小 ， 另 一 半 则 大 于 它 。 但 是 堆 是 非 
常 浓密 的 : 至 少 有 一 半 的 项 是 树叶 。 又 因为 堆 的 性 质 ， 大 部 分 比 插入 项 小 的 项 将 位 于 树叶 层 
或 接近 树叶 层 的 位 置 。 实 际 上 , 循环 迭代 的 平均 数量 小 于 3 (参见 Schaffer 和 Sedgewick，1993 )， 
这 就 满足 了 后 置 条 件 的 要 求 : averageTime(D) 是 常数 。 

针对 priority_queue 类 中 的 push 方 法 的 定义 ，averageTime(o) 是 常数 。 


D 
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现 企 可 以 分 析 push 方 法 了 。 当 堆 满 时 就 进入 了 最 坏 情 况 。 这 时 采取 的 行动 依赖 于 基础 容 
妖 类 一 一 例如 ， 癌 量 或 双 端 队列 。 无 论 如 何 将 需要 n 的 线性 关系 次 拷贝 ， 因 此 worstTime(n) 和 in 


成 线性 关系 。 但 是 这 个 拷贝 并 不 是 频繁 发 生 的 ， 每 n 次 插入 发 生 一 次 ， 因 此 averageTime(n) 是 


常数 (实际 上 ，、amortizedTime(n) 是 常数 )， 这 和 push_heap 方 法 是 相同 的 。 
pop_heap 方 法 的 接口 如 下 : 
// 前 置 条 件 : 堆 非 空 。 
// 后 置 条 件 : 从 堆 中 删除 last- 1 位置 上 的 项 。 
template<class RandomAccesslterator, class Compare> 
inline void pop_heap(RandomAccesslterator first, 
RandomAccessiterator last, Compare comp); 


XX fai last T XSBEDEU Z Wh. EE. pop_heap Hye 4 5jpush heapJ;iA4H/x: pop heap 
日 堆 顶 向 下 运行 。 顶 部 的 项 是 即将 被 删除 的 项 ， 它 将 被 存储 到 索引 是 last- 1 的 位 置 上 。( 将 保 
存 该 项 是 为 了 简化 sort_heap 方 法 。) 因此 将 last- 1 位 置 上 的 项 暂时 移 到 变量 value 里 。 最 初时 陷 
陡 征 堆 的 顶部 位 置 。 图 11-5 显 示 了 将 pop_heap 方 法 应 用 到 图 11-4 所 示 的 堆 上 时 的 初始 设置 


AAA 人 AN 


80 0 48 
value 


/\ / v 
26 32 35 107 


图 11-5 将 pop_heap 方 法 应 用 到 图 11-4 所 示 的 堆 上 时 的 初始 情况 
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图 11-6 将 陷阱 移动 到 90 占 据 的 位 置 之 后 图 11-5 中 所 示 的 堆 的 情况 


项 107 被 存储 在 超过 堆 底部 的 位 置 ， 但 是 仍 需要 找 出 55 (现在 存在 value 里 ) 可 以 存放 的 位 
置 。 不 用 在 55 和 其 他 项 之 间 比 较 ， 可 以 先 通过 陷阱 项 子女 间 的 相互 比较 将 陷阱 下 移 ， 较 大 的 
于 女 被 移动 到 陷阱 占据 的 位 置 ， 而 陷阱 则 被 设置 成 这 个 保存 较 大 子女 的 位 置 。 图 11-6 显 示 了 








REB TESS c 5 RA ie BZ AE. ETT AMAR Zin, PAE P OLB E , 
如 图 11-7 所 示 。 注 意 107 不 在 比较 之 列 ， 因 为 107 不 再 被 看 作 是 堆 的 一 部 分 。 
这 样 还 没有 彻底 完成 ， 因 为 55 不 能 被 插入 到 陷阱 的 位 置 。 因 此 现在 调用 push_heap 方 法 揪 


入 55。 图 11-8 显 示 了 最 终 得 到 的 树 ， 不 过 弹出 的 值 107 不 是 堆 的 一 部 分 。 
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图 11-7 将 陷阱 移动 到 35 "m" 11-6 中 所 示 的 堆 的 情况 
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图 11-8 对 图 11-4 中 的 堆 调用 pop_heap 方 法 之 后 的 情况 。 往 意 107 不 是 堆 的 一 部 分 


Pop-heap 方 法 的 真正 的 工作 是 在 辅助 方法 一 -adjust_heap 一 一 里 完成 的 。 下 面 是 
__adjust_heap 方 法 的 定义 : | 


| | template <clrzs RandomAccessiterator, class Distance, class T, 
| class Compare» 


| void — adjust. heap (RandomAccessiterator first, Distance holeIndex, 
Distance len, T value, Compare comp) 
C 
. Distance topindex = holelndex; mu 
. Distance secondChild — 2 * holeindex + 2; 
while (secondChild < len 
[ 
| If (comp(*(first + secondChild), *(first + (secondChild — 1)))) 
secondChild--; 
"(first + holelndex) = *(first * secondChild); 
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holelndex = secondChild; 
secondChild = 2 * (secondChild + 1); 


} 
if (secondChild == len) 


{ . 
*(first + holelndex) = “(first + (secondChild — 1)); 


holelndex = secondChild — 1; 


j 


__push_heap(first, holelndex, topindex, value, comp); 


} 


pop_heap 要 花费 多 长 时 间 ? 循环 将 陷阱 下 移 到 树叶 层 需要 的 时 间 和 树 的 高 度 是 成 比例 的 
堆 是 一 个 完全 二 又 树 ， 因 此 它 的 高 度 总 是 和 n 成 对 数 关 系 。 另 外 的 push_heap 调 用 将 花费 常数 
时 间 (平均 情况 下 ) 到 对 数 时 间 (最 坏 情 况 下 ， 因 为 不 需要 调整 大 小 )。 因 此 对 pop_heap 方 法 

言 ，worstTime(n) 和 nn 成 对 数 关 系 ，averageTime(n) 也 是 如 此 。 

我 们 需要 在 父亲 和 子女 之 间 便 捷 地 移动 。 使 用 随机 访问 迭代 器 (等 价 于 数组 索引 ) 可 以 
很 容易 地 实现 这 一 点 。 红 黑 树 也 可 以 很 容易 地 在 父亲 和 子女 之 间 移 动 ， 但 是 它 的 代价 是 需要 
额外 的 空间 : 存储 在 节点 中 的 每 一 项 都 需要 parent、color、left 和 right 字 段 。 相 比 之 下 堆 是 很 
出 色 的 : 每 个 项 都 不 需要 额外 的 空间 。 

最 后 考虑 make_heap 算 法 ， 它 通过 支持 随机 访问 迭代 器 的 容器 来 创建 一 个 堆 。 方 法 接 
口 是 : 

HARRİ: first (包括 在 内 ) 迭代 器 到 last (不 包括 在 内 ) 迭代 器 之 间 

/的 项 形成 一 个 堆 。 

template<class RandomAccesslterator, class Compare> 

inline void make_heap(RandomAccesslterator first, 

HandomAccesslterator last, Compare comp); 


first 项 就 是 堆 自 身 ， 网 此 可 以 出 单 地 循环 通过 容器 的 其 余部 分 并 在 每 次 先 代 中 调用 
push_heap: 


itr=first++; 
while(itr!zlast) 
push heap(first,itr---,comp); 

但 是 在 一 个 堆 中 有 一 半 的 项 是 树叶 ， 并 且 每 个 树叶 能 自动 成 为 一 个 堆 。 因 此 对 push_heap 
的 调用 有 一 半 都 是 浪费 。 | 

可 以 代替 的 方法 是 从 项 不 是 树叶 的 最 高 索引 处 开始 构造 堆 。 例 如 在 图 11-9 中 ， 从 项 30 的 
索引 处 开始 。 除 了 陷阱 索引 处 的 项 ， 即 30 将 被 临时 存放 在 变量 value 里 不 同 外 ， 这 个 调整 与 对 
Pop-heap 进 行 的 调整 很 相似 。 在 35 向 上 移动 到 陷阱 并 且 陷 阱 下 移 到 35 原 先 的 位 置 之 后 ， 调 用 
push_heap 将 30 插 入 陷阱 。 图 11-10 显 示 了 成 功 插入 30 之 后 树 的 外 观 。 接 着 移动 到 容器 中 较 低 
的 索引 ， 下 一 个 要 调整 的 是 以 40 为 根 的 子 树 ， 然 后 调整 以 70 为 根 的 子 树 。 这 时 得 到 的 树 如 图 
11-11 所 示 。 

为 了 使 以 50 为 根 的 子 树 满足 堆 属 性 ， 陷 阱 选择 在 50 所 占据 位 置 的 索引 ， 并 将 50 存 人 变量 
value。 将 55 移 进 陷 阱 之 后 ， 陷 阱 被 移动 到 55 原 先 占据 的 位 置 上 。 用 push_heap 方 法 将 50 插 入 这 
个 新 陷阱 开始 的 路 径 之 后 ， OE A FA A AB FE RA AET A JE O EE. 调整 之 后 得 到 的 堆 如 图 








11-12 所 示 。 


10 
一 人 
50 70 
40 30 60 80 
^ / 
15 55 35 


15 55 30 


图 11-10 对 图 11-9 的 完全 二 又 树 进行 调整 ， 使 以 30 为 根 的 子 树 满足 堆 属 性 之 后 的 情况 


| 10 
一 人 
50 | | 80 
55 35 60 70 
A / 
15 — 40 ... 30 


图 11-11 对 图 11-10 的 完全 二 叉 树 进行 调整 ， 使 以 40 和 70 为 根 的 子 树 都 满足 堆 属性 之 后 的 情况 


下 面 是 基本 的 代码 (一 adjust_heap 被 pop_heap 调 用 ; _adjust_heap 的 第 二 个 变 元 是 最 初 的 
陷阱 索引 ): | ec 


if (last — first « 2) 
return; 


worstTime(n) 总 是 和 nn 成 线性 关系 。 
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15 40 
图 11-12 对 图 11-11 中 的 完全 二 又 树 进行 调整 ， 使 根 为 50 和 10 的 子 树 满足 堆 属 性 之 后 的 情况 


Distance len = last — first; 
Distance parent = (len — 2) / 2; 


while (true) 
{ 
__adjust_heap (first, parent, len, T(*(first + parent)), comp); 
if (parent == 0) 
return; 
parent--; 
) // while 


make heap7j E HJ 22 Br W& ih Ee BRE, (ERE, RYE RC ITI RE 88 rp X Rc An fp HE, 
下 面 是 一 些 详细 情况 。 大 约 要 调整 mw2 个 堆 ， 而 且 每 次 调整 
花费 的 时 间 和 从 堆 的 根 到 它 最 远 树 叶 的 距离 成 比例 。 当 根 的 索引 i 从 n/2 下 降 到 0 时 ， 距 离 近 似 
为 logs(n/(i+1))。 很 充 座 的 是 ， 最 坏 情 况 出 现在 容器 已 经 是 一 个 堆 时 。 
需要 沿 着 树 的 一 条 路 径 下 降 寻 找 树 叶 陷 阱 ， 随 后 当 调用 push_heap 方 法 时 再 沿 着 相同 的 路 径 上 
升 。 因 此 最 坏 情 况 下 的 总 迭代 次 数 近似 为 : 


ni2 
$ 2log,(n/i) 


令 mm2。 回 亿 一 下 ， 商 的 对 数 等 于 对 数 的 差 ， 因 此 总 和 等 于 : 
2(mlog, n- > log, i) 
也 就 等 于 
2(mlog, n- log, d [i) = 2(mlog, n — log, (m!) 


对 数 的 总 和 是 乘积 的 对 数 。( 参 阅 附 录 A1.3 中 累 乘 表示 法 的 说 明 。) 
很 据 Stirling 的 阶乘 近似 的 对 数 形式 ， 
log;(m!) ~ log,((m/e)”) 
= mlog,m 一 mlog,e 


= mlog,m 一 1.5m 


因为 这 时 的 每 次 调整 都 
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E 4log,m=log,(n/2) = log.n ~ log;2 = log;n-1, 
2(mlog,n — log,m!) ~ 2(mlog,n 一 (mlog,m — 1.5m)) 
= 2(mlog,n 一 m(log;n- 1) +1.5m) 
= 2(m+1.5m) 
= 5m 
= 2.5n 


所 以 worstTime(n) 和 n 成 线性 关系 。 平 均 情况 下 需要 进行 约 一 半 次 数 的 迭代 ， 因 此 
averageTime(n) 也 和 nn 成 线性 关系 。 

现在 通过 迁 回 的 方法 揭示 了 priority_queue 类 的 实现 纪 节 ， 然 后 可 以 更 详细 地 研究 “公平 
性 ”问题 。 回想 一 下 ， 优 先 队 列 是 公平 的 ， 当 两 个 项 具有 相同 的 优先 级 ， 那 么 播 入 早 的 项 将 
先 被 访问 或 删除 。 


实验 26: 优先 队列 中 的 公平 性 (所 有 实验 都 是 可 选 的 ) 


11.1.4 priority_queue 类 的 另 一 种 设计 及 实现 


在 结束 对 priority_queue 类 的 设计 和 实现 之 前 ， 再 看 一 下 能 够 代替 堆 的 其 他 方案 。 正 如 前 
面 讨 论 过 的 ， 标 准 C++ 需 要 用 堆 来 实现 priority_queue 类 ; 但 也 很 容易 得 到 一 些 其 他 的 实现 ， 
并 且 它 们 可 以 提供 和 堆 相 当 的 作用 。 

一 种 实现 是 基于 列表 的 。 惟 一 的 字段 是 : 


list<value_type> C; 


基本 思想 是 将 优先 队列 中 的 项 按照 降序 存储 到 容器 c 中 ， 因 此 c 的 前 面 保存 了 高 优先 级 的 
项 。top 和 pop 方 法 只 不 过 是 分 别 调 用 了 c.front0 和 c.pop_front(0)， 因 此 这 些 方法 的 worstTime(m) 
是 常数 。 这 点 比 堆 实 现 强 ， 在 堆 版 本 中 它们 分 别 花费 常数 和 对 数 时 间 。 

push 方 法 也 是 单行 的 ， 但 更 复杂 些 。 回 忆 在 实验 11 中 ，upper_bound 通 用 型 算法 返回 一 个 
送 代 器 ， 它 位 于 容器 中 能 够 插 和 人 且 不 违背 顺序 关系 的 最 后 一 个 位 置 。 这 说 明了 项 应 当 被 插入 < 
里 的 位 置 : push 方 法 根据 项 的 相对 值 将 它 插 入 进 c 中 对 应 的 最 后 一 个 位 置 。 

void push (const value_type& x) | 
| c.insert (upper. bound (c. begin), ) c-end(), X, greater<value_type>), x 
) // 方法 push 


当 upper_bound 方 法 被 应 用 到 只 支持 双向 (不 是 随机 访问 ) 迭代 器 的 类 上 时 ， 它 花费 n 的 
线性 时 间 。 list 类 的 insert 方 法 只 花费 常数 时 间 ， 因此 push 的 worstTime(n) 和 n 成 线性 关系 ， 这 和 
push 方 法 的 堆 版 本 是 相同 的 。 但 是 这 个 push 版 本 的 averageTime(n) 也 和 n 成 线性 关系 ， ro hi 
本 则 花费 常数 时 间 。 又 因为 插入 项 总 是 存储 在 和 它 优先 级 相同 的 项 之 后 ， 因此 这 个 实现 是 公 
平 的 。 

为 一 种 有 意义 的 实现 使 用 了 set 容 器 ， 其 中 的 项 按照 降序 存储 


set«value type, greater<value_type>> c; 


D 


|. 
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同样 ，top、push 和 pop 方 法 都 是 单行 的 : 


const value type& top ( ) const 


{ 


return *(c.begin( )); 
) / 方法 top 


void push (const value_type& x) 


{ 
c insert (x); 
) // 方法 push 


void pop( ) 
{ 


c.erase (c.begin( )); 


) // 方法 pop 

根据 第 10 章 中 对 set 方 法 的 分 析 ，priority_queue 类 的 这 个 实现 中 的 top 方 法 需要 常数 时 间 。 
push 和 pop 方 法 的 worstTime(z) 则 和 z 成 对 数 关 系 。 

表 11-1 总 结 了 时 间 佑 算 。 当 然 ， 标 准 C++ 中 只 有 基于 堆 的 实现 才 是 合法 的 ， 但 是 其 他 的 实 
现 也 各 有 各 的 优点 。 


表 11-1 对 priority_queue 类 的 三 种 实现 ， 分 别 比 较 它们 的 top、push 和 pop 
方法 的 averageTime(n) 和 worstTime(n) (用 分 号 分 隔 ) 








实现 top push pop 
HE 0(1);0Q) O(1);0(n) O(logn);O(logn) 
列表 O(1:;0(1) O(n);O(n) O(1);0(1) 


集合 O(1);0(1): .. Ologn);O(logn) O(logn);O(logn) 
11.2 市 介绍 了 优先 队列 的 一 个 重要 的 应 用 : 数据 压缩 。 
11.2 优先 队列 的 应 用 : BRB 


假设 有 一 个 大 的 信息 文件 ， 如 果 能 够 在 不 丢失 任何 信息 的 前 提 下 将 文件 压缩 ， 节 约 空间 ， 
这 将 是 非常 有 利 的 。 更 重要 的 是 如 果 用 压缩 的 信息 代替 原始 信息 ， 那 么 传送 信息 花费 的 时 间 
也 将 大 大 减少 。 

人， 假设 消息 文件 M 包 含 100 000 个 字符 ， 并 且 每 个 字符 都 是 “a 
“or, "d^, ' 了 或 者 “8 "。 因 为 共有 七 个 字符 ， 所 以 如 果 和 希望 为 每 个 字 HARE 
的 位 ， 那么 可 以 用 ceil(iog) 即 3 个 位 对 每 个 字符 进行 了 惟一 的 编码 。 例 如 ， 可 以 为 “a” 采 用 
000, 为 “b” 采 用 001, 为 “c” 采 用 010， 依 次 类 推 。 像 “cad” 这 样 的 单词 可 以 编码 成 
010000011。 那 么 编码 文件 E 只 需要 300 000 个 位 ， 再 加 上 额外 的 几 个 表示 编码 信息 自身 的 位 : 
“a” =000, 24, 

还 可 以 减少 一 些 字符 的 位 的 数量 以 节约 空间 。 例 如 ， 可 以 使 用 下 面 的 编码 : 


O ceiloo) 返 回 大 于 等 于 xz 的 最 小 整数 。 例 如 ，ceil(17.2)=18。 





HRB 


a=0 

b=1 

c=00 

d=01 

e=10 

{=11 

g=000 | 

这 大 约 能 把 编码 文件 E 的 大 小 减少 三 分 之 一 【除非 字符 “g” 出 现 得 非常 频繁 )。 但 是 这 个 
编码 可 能 导致 二 义 性 。 例 如 ， 位 序列 001 可 以 被 解释 成 “ad” 或 者 “cb” 或 者 “aab”， 这 取决 
于 是 把 前 两 位 作为 一 组 ， 还 是 后 两 位 作为 一 组 ， 或 是 单独 地 对 待 每 一 位 。 

这 个 编码 方案 产生 二 义 性 的 原因 是 有 些 编码 是 其 他 编码 的 前 级 。 例 如 ，0 是 00 的 前 缀 ， 
此 不 可 能 确定 00 究 竟 表 示 “aa” 还 是 “c”。 通 过 令 编 码 无 前 缀 可 以 带 免 二 义 性 ， 也 就 是 说 ， 
任何 编码 都 不 是 其 他 编码 的 前 级 。 

无 前 级 编码 是 没有 二 义 性 的 。 

一 种 保证 编码 无 前 缀 位 的 方法 是 创建 一 个 二 又 树 ， 其 中 左边 的 树枝 解释 为 0， 右边 的 树枝 
解释 为 1。 如 果 每 个 编码 的 字符 是 树 中 的 一 个 树叶 ， 那 么 该 字符 的 编码 就 不 会 是 任何 其 他 字符 
编码 的 前 级 。 换 句 话 说 ， 到 每 个 字符 的 路 径 就 提供 了 无 前 绥 编 码 。 例如 ， 图 11-13 里 有 一 个 二 
叉 树 ， 说 明了 从 字符 “a” 到 字符 “g” 的 无 前 组 编码 。 

为 了 获取 一 个 字符 的 编码 ， 二 叉 树 的 根 从 空 编码 开始 ， 然 后 继续 ， 直 到 到 达 要 被 编码 的 
树叶 。 在 循环 中 ， 当 转向 左边 时 就 在 编码 中 添加 0 ， 转 向 右边 时 就 在 编码 中 添加 1。 例 如 ，“ 
锌 编码 成 01，“f” 被 编码 成 1110。 由 于 每 个 被 编码 的 字符 是 一 个 树叶 ， 所 以 该 编码 是 无 前 缀 
的 ， 因 此 也 无 二 义 性 。 但 是 还 不 能 确定 它 能 否 节约 空间 或 传送 时 间 。 这 完全 依赖 于 每 个 字符 


出 现 的 频率 。 因 为 有 三 个 编码 占 2 位 ， 四 个 编码 占 4 位 ， 所 以 这 个 编码 机 制 实 际 上 比 简单 的 每 


个 字符 3 位 的 编码 方式 要 占据 更 多 的 空间 。 

这 暗示 着 如 果 已 知 每 个 字符 的 频率 并 根据 这 些 频率 构造 编码 树 ， 将 可 能 节约 大 量 的 空间 。 
使 用 字符 频率 确定 编码 是 霍 夫 学 编码 (Huffman, 1952) 的 基本 思想 。 霍 夫 曼 编码 是 一 种 无 前 
缀 编码 策略 ， 它 保证 在 无 前 绥 编 码 中 是 最 优 的 。 霍 夫 曼 编 码 是 Unix 的 compress 实 用 程序 的 基 
础 ， 也 是 联合 图 像 专家 组 (Joint Photographic Experts Group, JPEG) 编码 处 理 的 一 一 部 分 。 

堆 夫 要 编码 利用 了 消息 中 每 个 字符 出 现 的 频率 。 

从 计算 一 个 给 定 消息 M 中 每 个 字符 的 频率 开始 。 注意 这 些 计算 的 时 间 和 M 的 长 度 成 线性 关 
系 。 例如 ， 假设 M 中 的 字符 是 字母 “a” 到 “8g ， 并 县 它们 的 频率 如 下 : 
a: 5000 "e 

b: 2000 

c: 10,000 
d: 8000 
e: 22,000 
f: 49,000 
g: 4000 


M 的 大 小 是 100 000 个 字符 。 如 果 忽 略 频 率 ， 并 将 每 个 字符 编码 成 惟一 的 三 位 序列 ， 那 么 
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共 需 要 300 000 个 位 来 编码 消息 M。 马 上 我 们 将 看 到 这 和 最 优 编码 相差 多 远 。 





图 11-13 产生 从 字母 “a” 到 字母 “g” 的 无 前 缀 编码 的 二 又 树 


按照 频率 的 升序 把 “字符 -频率 ”对 一 个 接 一 个 地 插入 到 优先 队列 中 。 

一 且 计 算出 每 个 字符 的 频率 ， 就 将 按照 频率 的 升序 将 “字符 -频率 ”对 一 个 接 一 个 地 插入 
到 优先 队列 中 。 因 此 优先 队列 中 顶部 的 “字符 -频率 ”对 将 包含 出 现 频率 最 会 的 字符 。 最 初 得 
到 的 优先 队列 是 : 

(b:2000)(g:4000)(a:5000)(d:8000)(c: 1 0000)(e:22000)(f:49000) 

事实 上 ， 我 们 对 这 个 优先 队列 的 全 部 认识 是 : 访问 和 删除 操作 的 对 象 是 (b:2000) 对 。 作 为 
priority_queue 类 的 用 户 ， 不 应 当 假 定 采取 堆 的 实现 形式 (即使 这 是 标准 C++ 中 的 当前 实现 )。 
所 显示 的 对 按照 升序 排列 只 是 为 了 简化 。 | 

TARERE- PREFS BR. FEM OLED ZR BEG eO UH BAIE, 
获得 两 个 频率 最 低 的 字符 〈 也 就 是 优先 级 最 高 的 )。 第 一 个 弹出 的 字符 “b” 成 为 二 又 树 最 大 
边 的 树叶 ,“g” 成 为 最 右边 的 树叶 。 它们 俩 的 频率 之 和 记 作 树 的 根 ， 并 插入 到 优先 队列 中 。 

现在 得 到 霍 夫 曼 树 : 
(6000) 
VN 
b g 

优先 队列 现在 包含 : 

(a:5000)( :6000)(d: 8000)(c:10000)(e:22000)(f:49000) 


从 技术 上 说 ， 优 先 队 列 和 霍 夫 曼 树 由 “字符 -频率 ”对 组 成 ; 但 是 当 两 个 频率 求 和 时 字符 
可 以 省 略 ， m e ma MTM TCU GRAN 实际 上 ， 算 法 操作 的 是 对 的 引用 而 
不 是 对 自身 。 这 使 得 可 以 用 引用 表示 左 ， 右 ， 根 ， 父 亲 ; 这 是 遍历 通 
WERK St Pie SER. 

当 从 优先 队列 中 弹出 对 (a:5000) 和 ( :6000) 时 ， 它 们 成 为 扩展 得 到 的 树 的 左 子 树 和 右 子 树 ， 
该 树 的 根 是 它 俩 的 频率 之 和 。 这 个 和 被 插入 到 优先 队列 里 。 现 在 得 到 的 霍 夫 曼 树 是 : 

(11000) 
9^7 
a (6000) 


YUL 


b g 











HA LF fo 3 363 


优先 队列 现在 包含 : | 

(d:8000)(c:10000)(:11000)(e:22000)(f:49000) 

EC EE 8 UC X Ir sti Hn HVBIUS SR CUIU ERNE. EVNIRABKERRK SRY, 
使 用 最 长 的 编码 。 出 现 频率 最 高 的 字符 ， 如 “f"” ， 最 终 将 放 在 接近 霍 夫 曼 树 根 的 位 置 ， 并 使 
用 最 短 的 编码 。 这 就 是 霍 夫 曼 编码 最 小 的 原因 。 

出 现 频率 最 低 的 字符 最 终 将 远离 霍 夫 曙 树 的 根 。 

当 弹 出 “d” 和 “c” 时 ， 它 们 不 能 连接 到 主干 树 上 ， 因 此 它们 就 成 为 另 一 个 树 的 左 分 枝 和 右 
分 枝 ， 而 该 树 的 根 一 一 它们 的 总 和 一 一 被 插入 到 优先 队列 中 。 这 样 得 到 了 两 个 临时 的 霍 夫 曼 树 : 


(11000) (18000) 
0 ] 0 1 
a (6000) d c 
AN 
( ; 


优先 队列 现在 包含 : 

(:11000)(:18000)(e:22000)(f:49000) 

当 弹 出 对 (:11000) 时 ， 它 成 为 二 叉 树 左边 的 树枝 ， 而 右边 的 树枝 是 下 一 个 弹出 的 对 
(418000)。 它 俩 的 和 成 为 这 个 二 叉 树 的 根 ， 并 被 插入 到 优先 队列 中 ， 因 此 得 到 霍 夫 曼 树 : 


优先 队列 现在 包含 : ` 

(22000 2800045000 

当 弹 出 下 两 个 对 时 ， ”成 为 霍 夫 曼 树 左边 的 树枝 ， 而 (: 29000) 成 为 右边 的 树枝 ， 根 
(:51000) 被 插入 到 优先 队列 7 最 后 弹出 两 个 对 (f: 49000) 和 (: 51000) 分 别 成 为 最 后 的 霍 夫 曼 树 
的 左右 树枝 。 这 两 个 频率 的 和 是 根 的 频率 (:100000)， 它 将 作为 惟一 的 项 插入 到 优先 队列 中 。 
最 终 得 到 的 霍 夫 晕 树 如 图 11- 14 所 示 。 ERRATE: | IE | 

a:1100 | 

b:11010 

c:1111 

d:1110 

e:10 

f:0 
g:11011 


A 
Un 
OO 


A 
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图 11-14 AE JE A URBI 


现在 把 消息 M 翻 译 成 编码 消息 E 是 很 容易 的 。 接 收 端 怎么 样 呢 ? 能 不 能 很 容易 地 将 下 解码 
成 原始 消息 M? 从 树 根 和 BE 的 开头 起 ， 为 中 的 0 选取 左 树枝 ， 为 1 选取 布 树枝 ， 继 续 这 样 直到 
到 达 一 个 树叶 ， 这 就 是 M 中 的 第 一 个 字符 。 再 返回 树 的 顶部 并 继续 读 E。 例 如 ， 如 果 M 是 
‘cede ， 那 么 E 就 是 111110111010。 从 树 根 开 始 ，E 开 头 的 四 个 1 将 通 向 树叶 “c 。 然 后 返回 
树 根 并 继续 读 E， 读 入 第 5 个 1。 为 这 个 1 选取 右 树枝 ， 然 后 为 0 选取 左 树 枝 ， 到 达 “e”。 依 次 
类 推 。 

消息 E 的 大 小 等 于 M 中 所 有 字符 对 应 的 字符 编码 位 数 与 该 字符 频率 的 乘积 之 和 。 因 此 要 得 
到 这 个 例子 中 E 的 大 小 ， 需 要 将 “a” 编 码 中 的 位 数 4 和 “a” 出 现 的 频率 5000 相 乘 ， 加 上 “b” 
编码 中 的 位 数 5 和 “b” 出 现 的 频率 2000 相 乘 ， 等 等 。 得 到 | 

(4 x 5000) + (5 x 2000) + (4 x 10 000) + (4 x 8000) + (2 x 21000) 

+ (1 x 49 000)+(5 x 4000) = 213 000 | 

这 大 约 比 固定 长 度 的 每 个 字符 3 位 的 编码 方式 少 百 分 之 三 十 ， 因 此 显著 地 节约 了 空间 和 传 
送 时 间 。 但 是 也 应 当 注 意 到 ， 固 定 长 度 的 编码 一 般 要 比 霍 夫 曼 编码 解码 快 很 多 : 例如 ， 编 码 
位 可 以 解释 成 数组 索引 一 一 该 索引 上 的 条 目 就 是 编码 对 应 的 字符 。 


11.2.4 huffman 类 的 设计 


要 了 解 霍 夫 曼 树 的 本 质 ， 现 在 来 开发 一 个 hufftman 类 处 理 消息 的 编码 。 消 息 将 放 在 一 个 输 
人 文件 中 ， 而 编码 消息 将 发 送 给 一 个 输出 文件 。 构 造 器 初始 化 huffman 对 象 (包括 输入 和 输出 
文件 ) ， 给 定 路 径 名 : 
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// 后 置 条 件 : 根据 in_file_name 和 out_file_name 初 始 化 这 个 huffman 对 象 。 
huffman(string in_file_name, string out_file_name); 


另 一 个 要 执行 的 任务 是 很 容易 确定 的 : 需要 创建 优先 队列 和 霍 夫 曼 树 ， 计 算 霍 夫 曼 编码 ， 
最 后 将 霍 夫 曼 编 码 和 编码 后 的 消息 保存 到 输出 文件 中 。 方 法 接口 是 : | 


NBR: 创建 优先 队列 。worstTime(n) 是 O(n). 
void create pq(); 


HU: SUERTE, 


void create huffman tree(); 


// 后 置 条 件 : HEKRA. 
void calculate huffman codes(); 


// 后 置 条 件 : 将 霍 夫 受 编码 和 编码 后 的 消息 存储 到 输出 文件 中 。worstTime(n) 
// 是 O(n)。 
void save_to_file(); 


A XR BEP BUS Rees HRB (字符 、 它 的 频率 和 它 的 编码 ) 以 及 一 些 二 
又 树 信息 〈 指 向 左 子 树 、 右 子 树 和 父亲 的 指针 ) huffman_nodeX RA A Hhuffman3s rh, 
这 样 其 他 的 类 ， 比 如 解码 一 个 编码 消息 的 类 ， 也 可 以 访问 huffman_node 类 。 

下 面 是 huffman_node 类 ， 它 的 字段 全 部 是 公有 的 并 且 没 有 方法 : 

struct huffman_node; 

typedef hufíman node* node ptr; 


struct huffman node 
{ 
char id; 
int freq; 
string code; 
node_ptr left, 
right, - 
- parent; 
y; // huffman_node 


hufftman 类 有 一 个 嵌入 的 函数 类 一 一 compare。 当 然 ，compare 类 没有 字段 ， 并 且 只 有 一 个 
方法 一 一 Operator()。 
class compare 
ue 
public: 


bool operator( ) (const node. ptr& c1, 
const node ptr& c2) const 
| 
return (*c1).freq > (*c2).freq; 


} // 重 载运 算 符 () 
} // 类 compare 
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由 于 在 比较 中 使 用 了 operator>， 所 以 在 优先 队列 里 频率 最 低 的 项 将 具有 最 高 的 优先 级 。 

在 huffman 类 中 还 应 当 有 哪些 字段 ? 给 定 输入 中 的 一 个 字符 ， 我 们 希望 能 快速 地 访问 它 的 
hufftman_node。 通 过 创建 一 个 索引 是 字符 自身 的 数组 ， 就 可 以 利用 数组 的 随机 访问 性 质 得 到 
常数 时 间 的 访问 : | 

static const int MAX SIZE-256; /只 有 对 静态 整数 常量 才 合 ; 

node_ptr node_array[MAX_SIZE]; 

这 就 为 ASCII 字 符 集中 的 每 个 字符 提供 了 一 个 数组 位 置 。 例 如 ， 在 霍 夫 曼 编码 的 例子 中 ， 
“d” 的 频率 是 8000， 而 “d” 的 编码 是 “1110”。 该 字符 的 信息 就 存储 在 位 于 索引 (int) 'd'， 也 
就 是 99 上 的 指针 指 加 的 结构 struct 中 。 因 此 node_array 中 会 有 部 分 如 下 : 


(to “c”) 
voce aray teo) [a o Timo [wa [wo PS 


还 需要 一 个 优先 队列 ， 一 个 输入 文件 ， 一 个 输出 文件 和 一 个 输入 文件 名 。 输 入 文件 名 使 
我 们 可 以 打开 输入 文件 两 次 : 一 次 是 计算 频率 ， 后 一 次 是 编码 消息 。 因 此 在 hufftman 中 有 如 下 
的 字段 : | 

priority queue« node ptr, vector«node ptr», compare > pq; 


fstream in. file, 
out. file; 





string in file name; 

在 依赖 关系 图 中 ， 

pq 
in_file 


huffman € 
out file 


AN 


in file name 


所 有 的 字段 ， 即 使 是 in_file 和 out_file ， 都 表示 复合 ， 因 为 在 huffman 类 之 外 没有 对 这 些 文 
件 的 引用 。 | 

这 就 完成 了 huffman 类 的 设计 ， 粗略 地 说 是 头 文件 huffman hb 的 设计 。 在 11 2.2 市 中 将 关注 
产 文 件 huffman.cpp。 


11.2.2 huffman 类 的 实现 
构造 器 像 计划 地 那样 打开 文件 : 
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huffman::huffman (string in_file_name, string out_file_name) 
{ | 
("this).in file name = in file name; 
in file.open (in file name.c str( ), ios::in); 


out, file.open (out file name.c str( ), ios::out); 


) / 构造 器 
create_pq 方 法 首先 填充 node_array ， 然 后 据 此 填充 优先 队列 pq: 


void huffman::create_pa( ) 


{ 
const string DEFAULT_TOTAL = 


"With a fixed number of bits per character, the message size in bits is "; 
node ptr entry; 


int sum = 0, 
n chars = 0, 
n bits per char; 
for (int i = 0; i < MAX SIZE; i++) 
{ 
node_array [i] = new huffman_node; 


("node array [i]).freq = 0; 
} /初始 化 数组 


create node array( ; 


for (int i = 0; i < MAX SIZE; i+ +) 
{ 

entry = node array [i]; 

if ((*entry).freq > 0) 

{ 


pq.push (entry); 
sum += (*entry).freq; 
n_chars+ +; 
}// if 
} / 计算 字符 和 频率 


n_bits_per_char = ceil(log (n chars) / log(2)); 
cout « «endl « «DEFAULT. TOTAL 
| « «(sum * n bits per char) «endl; 
) // create pq | 


n_bits_per_char 的 计算 需要 解释 一 下 。 在 C++ 中 ， log 消 数 返 回 它 的 变量 的 自然 对 数 (也 就 
是 以 e 作 为 底数 )。 应 用 附录 1 中 对 数 的 性 质 将 底数 e 转 换 成 底数 2。 l | 

create node_array 方 法 处 理 了 一 个 很 有 趣 的 问题 。 每 次 从 名 为 in_file 的 输入 文件 中 读 入 -- 
行 之 后 ， 就 在 node_array 中 为 新 行 标记 创建 一 个 条 目 。 因此 输入 文件 中 的 空 自行 不 会 被 包 咯 ， 
但 是 应 当 如 何 读 入 一 行 呢 ? 肯 定 不 能 使 用 


in file»»line; 


HEN AFoperator>> JH BERE MAMA E EL UR 5 标记 )， 然后 不 断 读 和 人， 


463 





368 


Mul 














PIA 











void huffman::create_node_array( ) 


{ 


node_ptr entry; 
string line; 


while (getline (in_file, line)) 


{ 


for (unsigned j = 0; j < line.length( ); j+ +) 


{ 
entry = node array [(int)(line [j])]; 


(“entry).freq+ +; 
if ('entry).freq == 1) 
{ 
(“entry).left = NULL; 
("entry).right = NULL; 
(“entry).parent = NULL; 
JU 字符 第 1 次 出 现 
) / for 
entry = node array [(int)^n']; 
('entry).freq-- +; 
("entry).left = NULL; 
("entry).right = NULL; 
(“entry).parent = NULL; 


) // while 
) // create node array 


create huffman tree7j i3; 011.25 f x B) — HE: 


void huffman::create huffman tree( ) 


{ 


node_ptr left, 


right, 
sum; 


while( pq.size( ) > 1) 


{ 


left = pq.top( ); 
pq.pop( ); 
("left).code = string ("0"); 


right = pq.top( ); 
pq.popí ); 
(*right).code = string ("1"); 


sum = new huffman node; 
(“sum).parent = NULL; 

(“sum).freq = ('left).freq + (*right).freq ; 
(*sum).left = left; 


"HL An. Aro RE getlineji A — 
行 并 且 不 "n 2A. 下 面 是 cnate_node anoyi: 
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(*sum).right = right; 
("left).parent = sum; 
(*right).parent = sum; 


pq.push( sum ); 
) // while | 
) // create huffman tree 465 


calculate huffman codes; iik (ish node, array, HEA EMRE ERA, HPI 
方式 为 它 创 建 编码 : 从 一 个 空 string 变 量 code 开 始 ， 将 条 目的 编码 字段 添加 进 code ， 然 后 用 条 
目的 父亲 替换 条 目 。code 的 最 终 值 将 作为 该 条 目的 code 字 段 插 入 node_array。 

例如 ， 假 设 部 分 霍 夫 曼 树 如 下 : 


那么 “B” 的 编码 应 当 在 4 次 迭代 中 计算 ， 每 次 迭代 后 得 到 的 编码 值 如 下 : 
0 m 

00 

100 

0100 


XX = FFB, "0100", 存储 在 nodeArray 的 索引 66 处 的 节点 的 code 字 段 中 ， 回想 一 下 ， 在 
ASCI 码 序列 中 (int)'B'=66。 
下 面 是 方法 定义 : 


void huffman::calculate_huffman_codes( ) 
{ | | 
const string HUFFMAN CODES = "Here are the Huffman codes: ": 


const string ENCODED. SIZE MESSAGE = 
AnnThe size of the encoded message, in bits, is "; 


int total — O; 


string code; 
node ptr entry; 


cout « «endi « «HUFFMAN CODES <<endl; 
for (int i = 0; i < MAX SIZE; i++) 
{ 

code = "* 

entry = node_array [i]; 

if ((*entry).freq > 0) 

{ 


cout <<(char)i <<" "; 


do mn 
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code = ('entry).code + code; 
entry = ('entry).parent; 
\iido 
while ((*entry).parent != NULL); 


cout « «code <<endl; 
("node array [i]).code = code; 
total += code.length( ) * (*node array [i]).freq ; 
) // if 
) // for 
cout ««ENCODED SIZE MESSAGE « «total « «endl; 
) // calculate huffman codes 


HifEnode, array & T ET EINK DHS, SRT ATA OVE CHE. AES 
编码 一 一 例如 “a”0100， 又 包含 编码 后 的 消息 。 因 此 首先 将 霍 夫 曼 编码 写 到 输出 文件 里 ， 然 
后 重读 输入 文件 ， 编 码 每 个 字符 ， 而 且 将 编码 后 的 消息 发 送 到 输出 文件 中 。 下 面 是 定义 : 


void huffman::save_to_file( ) 


{ 


node_ptr entry; 
string line; 


in file.close( ); 
in. file.open (in file name.c str( ), ios::in); 


for (int i = 0; i < MAX SIZE; i++) 


{ 
entry = node_array [i]; 
if ((“entry).freq > 0) 
out file <<(char)i <<" " ««(*entry).code <<endi: 
) // for | 


out file « —"**" <<endl; 


while (getline (in. file, line)) 
{ 
for (unsigned j = 0; j < line.length( ); j++) 
{ 
entry = node array [(int)(line [j])]; 
out file « «(*entry).code; 
) // for 
entry = node array [(int)^n']; 
out file « «(*entry).code; 
) / while 
out file.close( ); 
) // save to file 


这 总 共 将 花费 多 长 时 间 ? 令 z 为 输入 消息 中 的 字符 数量 。create_node_array 和 save to. file 
方法 都 迭代 通过 消息 ， 因 此 这 两 个 方法 的 worstTime(n) 和 n 成 线性 关系 。create_pq 方 法 只 花费 





HAR 


线性 时 间 是 因为 它 调 用 了 create_node_array 来 计算 每 个 字符 的 频率 : create_pq 的 其 余部 分 只 用 
常数 时 间 ， 因 为 至 多 能 有 256 个 项 插入 优先 队列 中 。 同 理 ，create_huffman_tree 和 
calculate_huffman_codes 方 法 只 花费 常数 时 间 。save_to_file 方 法 读 取 输入 文件 ， 因 此 
worstTime(n) 4h, Fl X £X EK HR 

希望 编码 一 个 消息 的 用 户 可 以 调用 这 些 方 法 。 例 如 ， 如 果 输 入 文件 包含 : 


more money needed 


那么 输出 文件 将 是 : 


0000 
100 

d 1011 
e ll 
m 001 
n Oll 
o 010 

r 0001 

y 1010 


ck 


00101000011110000101001111101010100011111110111110110000 


”在 这 个 编码 中 ， 新 行 字符 是 非 打印 字符 ， 因 此 在 显示 它 时 是 空白 。 但 是 打印 该 字符 会 导 
致 显示 个 新 行 ， 因此 得 到 一 个 空 行 并 且 在 下 一 行 上 有 一 个 空格 和 编码 0000。 
随后 另 一 个 用 户 可 能 想 解 码 这 个 消息 。 这 要 分 两 步 完 成 : 首先 ， 必 须 读 入 编码 重新 构造 


翟 夫 曼 树 ;其 次 ， 读 和 人 编码 的 消息 并 输出 解码 后 的 消息 ， 这 应 当 和 原 消 息 一 致 。 编 程 项 目 


11.1 要 求解 码 被 编码 的 消息 。 所 有 的 相关 文件 可 以 参阅 本 书 的 源 代码 链接 。 

在 寻找 金 局 最 优 的 解决 方案 时 ， 贪 心算 法 做 出 了 局 部 最 优 的 选择 。 

和 翟 夫 曼 编码 是 贪心 算法 的 一 个 例子 : 当 打算 做 出 一 个 选择 时 ， 就 选择 最 经 济 的 选项 。 在 
霍 夫 曼 编 码 的 上 下 文中 ， 加 入 霍 夫 曼 树 的 下 一 项 是 频率 最 低 的 “字符 -频率 ”对 。 这 样 的 对 总 
是 位 于 优先 队列 的 顶部 。 在 霍 夫 曼 编码 的 情况 中 ， 贪 心 成 功 了 : 得 到 的 编码 使 用 了 数量 最 少 
的 位 。 在 第 14 章 里 还 有 两 个 贪心 算法 的 例子 ， 它 们 也 使 用 了 优先 队列 ， 习题 14.6 中 则 说 明了 
并 非 总 能 成 功 的 贪心 。 


总 结 


本 章 介绍 了 优先 队列 : 它 是 一 个 容器 ， 根 据 一 定 方式 为 项 分 配 优先 级 ， 其 中 只 有 优先 级 
最 高 的 项 才能 被 访问 和 删除 。 访问 的 worstTime(n) 是 常数 , 但 是 删除 的 worstTime(n) 是 O(logn)。 
项 在 优先 队列 中 插入 的 位 置 没有 任何 约束 ,但 是 它 的 worstTime(n) 必 定 是 0(n)， 
averageTime(n) 必 定 是 常数 ， | 

在 priority_queue 类 的 设计 中 ， 项 被 存储 在 一 个 维 中 。 堆 ! 是 一 个 完全 二 叉 树 ，! 或 者 为 空 ， 
或 者 满足 : 

1) 根据 项 之 则 的 某 些 比较 方法 ， 根 项 是 t 中 最 大 的 项 。 

2) leftTree(t)fflrightTree(t) 88 Je ME . 


A 
oo 


A 
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因为 完全 二 又 树 可 以 通过 子女 的 索引 计算 父亲 的 索引 ， 反 之 亦 然 ， 所 以 堆 可 以 用 一 个 数 
组 表示 。 这 样 就 可 以 利用 数组 的 随机 访问 能 力 访 问 一 个 给 定 索引 上 的 项 。 

优先 队列 可 以 应 用 在 数据 压缩 领域 。 给 定 一 个 消息 ， 它 可 以 将 其 中 的 每 个 字符 无 二 义 性 
地 编码 成 最 少数 量 的 位 。 一 种 获得 最 小 编码 的 方法 是 使 用 霍 夫 曼 树 。 霍 夫 曼 树 是 一 个 _- 树 ， 
其 中 每 个 树叶 代表 原 信息 中 一 个 不 同 的 字符 ， 每 个 左 树枝 用 0 标记 ， 而 每 个 右 树枝 用 1 标记 。 
通过 跟踪 从 每 个 字符 树叶 返回 根 的 路 径 ， 并 将 这 个 路 径 上 每 个 树枝 的 标记 添加 进去 ， 就 可 以 
得 到 该 字符 的 堆 夫 曼 编 码 。 


习题 
11.1 再 次 观察 图 11-12， 说 明 对 图 中 的 堆 连 续 进行 下 面 的 变动 的 相关 步 双 : 
80 
55 70 
A^ 35 60 10 
15 40 30 
a. push(83); 
b. push(61); 
c. pop(); 


11.2 阐述 优先 队列 的 惠普 的 实现 的 不 公平 性 。 也 就 是 说 ， 举 出 优先 队列 中 的 优先 级 最 高 
的 两 项 ， 但 是 先 插入 的 项 并 不 是 先 被 删除 的 项 。 

11.3 假设 一 个 vector 容 器 cl 包含 下 面 的 项 的 序列 : 10, 20, 30, 40, 50, 60, 70, 80, 90, 
100。 说 明 在 调用 下 面 的 方法 时 会 发 生 什么 情况 : 
make heap(c1.begin(), c1.end(), less<int>): 

11.4 假 设 一 个 vector 容 器 c2 包 含 和 习题 11.3 中 c1 相 同 的 项 ， 不 过 顺序 相反 。 说 明 在 调用 下 
面 的 方法 时 会 发 生 什 么 情况 : 
make_heap(c2.begin(), c2.end(), less<int>); 


11.5 估算 习题 11.3 中 make_heap 调 用 的 时 间 花 费 相 对 于 习题 11.4 中 make_heap 调 用 的 时 间 
花费 。 
11.6 为 下 面 的 字符 频率 创建 “字符 -频率 ”对 的 堆 (最 高 优先 级 = 最 低频 率 ): 
a:5,000 | 
b:2,000 
c: 10,000 
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d:8,000 
e:22,000 
f:49,000 
g:4,000 
11.7 FAAP RYE KS GH A ie] “faced” M—F SI: 
a:1100 
b:11010 
c:1111 
d:1110 
e:10 
f:0 
11.8 使 用 下 面 的 霍 夫 曼 树 将 位 序列 11101011111100111010 翻 译 成 从 和“a' B "g^ 的 字母 : — [470 


(100000) 
0 l 
f (51000) 
YN 
e (29000) 
IN 
(11000) (18000) 
a (6000) d c 
YN 
b g 
11.9 AYP AY FE KS ARD, 举例 说 明 一 个 5 位 且 不 能 是 任何 编码 消息 开头 的 序列 : 
a:1100 oo mE 
b:11010 
c:1111 | | 
diio — c 
e:10 
f:0 


能 否 找到 另 一 个 这 样 的 5 位 序列 ? 解释 原因 。 
11.10 霍 夫 曼 树 必须 是 二 - 树 吗 ”解释 原因 。 
11.11 描述 用 从 “a” 到“h” 的 字母 创建 一 个 消息 的 过 程 ， 其 中 两 个 字母 的 霍 夫 曼 编码 是 
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7 位 。 再 用 从 “a'” H 'h' ROS ROTA. E rA EREK Sah ED 
是 3 位 。 
11.12 在 习题 11.8 的 霍 夫 曼 树 中 ， 所 有 非 叶 节点 的 频率 总 和 是 215 000。 这 也 是 编码 消息 E 
的 大 小 。 说 明 为 什么 在 任何 霍 夫 曼 树 中 ， 所 有 非 叶 节 点 的 频率 之 和 总 是 等 于 编码 请 
471 息 的 大 小 。 | 
11.13 为 下 面 的 堆 调 用 pop_heap 方 法 时 需要 多 少 次 循环 迭代 ? 能 不 能 找到 一 个 项 的 数量 相 
同 但 pop_heap 方 法 需要 更 多 迭代 次 数 的 堆 ? 


890 900 
880 50 49 800 


870 48 47 人 45 人 人 700 
860 42 41 =- 29 600 
850 
472 11.14 在 hufftman 类 中 ， 并 没有 用 hufftman_node 类 的 id 字段 。 为 什么 遗漏 了 这 个 字段 ? 


编程 项 目 11.1: 解码 一 个 消息 


假设 一 个 消息 使 用 霍 夫 曼 编码 进行 了 编制 。 开 发 一 个 项 目 解码 这 个 编制 后 的 消息 ， 从 而 
获得 原始 消息 。 

分 析 

正如 本 章 的 霍 夫 曼 应 用 中 的 输出 文件 所 示 ， 输 入 文件 将 由 两 部 分 组 成 : 

每 个 字符 和 它 的 编码 

编码 后 的 消息 | 

假设 文件 hufftman.ou1 包 含 了 下 面 的 内 容 (由 于 页 面 所 限 ， 编 码 后 的 消息 被 分 成 三 行 ) 

0010 | 
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** 


100001001110011011001 0011001110011000101110100001001 001001100000100111010 
000010011100110000100010111111111111111111111111111110010 | 


系统 测试 1 


in the Input line, please enter the name of the input file. 
huffman.ou1 


in the Input line, please enter the name of the output file. 
decode.ou1 


Please press the Enter key to close this output window. 


文件 decode.oul 将 包含 : 


bad cede cab dab 
dead dad cad 
bbbbbbbbbbbbbbbbbbbbbbbbbbbbb 


假设 文件 hufftman.ou2 包 含 了 下 面 的 内 容 (消息 来 自 Coleridge 的 “Rubiyat of Omar 
Khayam" ): 


10000 
101 
, 001110 
. 0011010 
A 001100 
D 0010100 
| 0010101 
K 001111 
T 0010010 
W 0010110 
X 0010111 
a 1111 
b 011000 
c 00000 
d 11011 
e 010 
g 0010011 
h 11100 
i 100011 
m 00001 
nott 
s 1100 
t 01101 
u 11101 
v 100010 


w 001000 
y 0011011 
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0000101 100001010010001010r10071001010110t11010 101010000 b 
111110111001110100 100: 000011 smonón: E 
indito 100111010111000101011001 001011100010111 


系统 测试 2 
人 Mt NM REE 
ORON - the — oi - am | E Ed 









am ic. - 
SES ERE 2 





p " j 3 the Enter key to close this output window. = 
文件 decode.ou2 将 包含 : 


In Xanadu did Kubla Khan 

A stately pleasure dome decree, 
Where Alph the sacred river ran 
Through caverns numberless to man, 
Down to a sunless sea. 
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排序 是 最 重要 的 常用 计算 机 操作 之 一 ， 也 就 是 将 容器 中 的 项 按照 顺序 排列 。 从 早期 简单 
的 小 容器 排序 到 高 效 的 频繁 使 用 的 邮件 列表 和 字典 排序 ， 在 各 种 各 样 的 排序 算法 中 进行 选择 
始终 是 每 个 编程 者 的 -项 重要 技术 。 本 章 所 讨论 的 大 多 数 排序 算法 都 赛 括 在 标准 模板 库 中 ， 
不 过 它们 的 实现 留 给 开发 者 自己 完成 。 更 明确 地 说 是 我 们 将 研究 惠普 的 实现 。 另 外 的 几 种 排 
序 算 法 ， 像 选择 排序 、 冒 泡 排序 和 基数 排序 ， 这 些 将 在 习题 中 进行 研究 。 


目标 


1) 能 够 判断 究竟 哪 种 排序 算法 适合 某 个 具体 的 应 用 。 
2) 了 解 每 个 排序 算法 的 缺陷 。 
3) 解释 分 治 法 算法 的 标准 。 


12.1 介绍 


本 章 只 考虑 基于 比较 的 排序 ， 也 就 是 需要 将 项 和 其 他 项 进行 比较 的 排序 。 如 果 预 先知 道 
每 个 项 的 最 终 位 置 ， 那 么 比较 就 不 是 必需 的 。 例 如 ， 如 果 开 始 时 是 未 排序 的 100 个 不 同 的 从 0 
到 99 的 整数 ， 那 么 不 需要 比较 也 知道 整数 0 最 后 必定 在 位 置 0， 依 次 类 推 。 最 为 流传 的 不 基 
于 比较 的 排序 算法 是 基数 排序 ， 见 习题 12.14。 

每 个 排序 算法 的 用 户 可 以 选择 缺 省 的 比较 运算 符 一 一 operator<， 或 是 提供 一 个 函数 对 象 
用 于 项 的 比较 。 如 果 选 择 缺 省 情况 ， 于 全 排序 的 结 共 将 古 按 照 升序 排列 的 集合 为 了 简化 ， 
在 本 章 中 将 使 用 缺 省 的 operator<。 

在 分 析 一 个 排序 方法 的 过 程 中 ，averageTime(n) 和 worstTime(n) 都 是 非常 重要 的 。 在 某 些 
应 用 中 ， 像 国防 和 生命 支持 系统 ， 排序 算法 在 最 坏 情况 下 的 性 能 是 很 关键 的 。 我 们 将 了 解 到 
几 种 排序 算法 ， 它们 提供 了 几 种 保险 策略 ， 以 避免 出 现 难以 接受 的 非常 差 的 最 坏 情况 。 

我 们 通过 下 面 的 10 个 整数 说 明 每 个 方法 的 结果 : 

59 46 32 80 46 55 87 43 70 81 | | 

排序 算法 的 空间 需要 是 值得 一 提 的 。 大 部 分 算法 的 空间 需要 都 是 很 小 的 :少许 迭代 器 和 
索引 ， 以 及 用 来 保存 一 个 项 的 临时 变量 。 快 速 排 序 的 averageSpace(n) 和 nn 成 对 数 关 系 ， 
worst8pace(n) 和 n 成 线性 关系 。 而 树 排序 的 averageSpace(n) 和 worstSpace(n) 都 和 n 成 线性 关系 。 

另 一 个 用 来 评估 排序 算法 的 标准 是 稳定 性 。 一 个 稳定 的 排序 方法 保持 了 相等 项 的 相对 顺 
序 。 例 如 ， 假 设 有 一 个 关于 学 生 的 vector 容 器 ， 其 中 每 个 条 目 由 学 生 的 姓 和 该 学 生 的 总 成 绩 数 
组 成 ， 并 和 希望 根据 总 成 绩 数 排序 。 如 果 排 序 方法 是 稳定 的 ,而 (^Balan", 28) 出 现在 比 
("Wang", 28) 之 前 的 索引 上 ， 那 么 在 排序 之 后 (“Balan”, 28) 将 仍然 出 现在 (" Wang", 28) 
之 前 。 稳 定性 可 以 简化 项 目的 开发 。 例 如 ， 假设 上 面 的 vector 容 器 已 经 按照 姓名 排序 ， 又 要 求 
应 用 程序 根据 成 绩 数 排序 ; 而 成 绩 数 相同 的 学 生 应 当 按照 字母 表 顺 序 排 列 。 稳定 的 排序 不 需 
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要 做 任何 额外 的 工作 ， 就 可 以 确保 相同 成 绩 数 的 学 生 按 照 字母 表 顺 序 排列 。 
下 面 将 开始 讨论 一 种 排序 算法 ， 它 的 独立 性 能 很 差 ， 不 过 和 其 他 排序 算法 相 结 合 时 将 得 
到 最 快 的 《平均 情况 下 ) 运行 时 间 。 


插入 排序 


假设 即将 排序 的 项 是 在 一 个 支持 随机 访问 返 代 器 的 容器 中 。 用 和 迭代 器 i 循 环 通过 容器 。 在 
每 次 循环 迭代 中 ， 使 用 另 一 个 循环 根据 小 于 i 的 位 置 上 的 项 将 *i 插 和 人 到 其 对 应 的 位 置 。 例 如 ， 
假设 位 于 下 面 项 中 最 右边 的 项 : 

32 45 59 80 91 46 

PAEIKTIARZIA, HA 

32 45 46 59 80 91 


. insertion. sorte iJ: Ae 


template <class RandomAccessiterator> 
void __insertion_sort(RandomAccesslterator first, 
RandomAccesslterator last) 
{ 
if (first == last) 
return; 
for (RandomAccesslterator i = first + 1; į != last; ++i) 
__linear_insert(first, i, value_type(first)); 


} 


在 _linear_insert 调 用 中 ,第 三 个 变 元 使 我 们 可 以 确定 项 的 类 型 。 为 了 最 高 效 地 插入 *i， 
一 linear_insert 的 代码 比 预想 得 要 复杂 得 多 。 和 变 元 first 和 i 相对 应 的 分 别 是 参数 first 和 last， 将 
“last 保 存在 一 个 局 部 变量 value 中 。 如 果 value<*first， 就 把 frst 到 last-1 之 间 的 项 (向 后 ) dE DI 
到 first+1 和 last 之 间 ; 然后 将 value 存 储 到 first 中 。 例 如 ， 假 设 i 位 于 下 列 项 中 索引 4 的 位 置 : 

46 59 85 91 32 


将 32 保 存在 value 里 ， 把 91 移 动 到 32 原 先 的 位 置 ， 85 移 动 到 91 原 先 的 位 置 ，59 移 动 到 85 原 先 的 
位 置 ， 再 把 46 移 动 到 59 原 先 的 位 置 。 最 后 将 value 移 动 到 46 原 先 的 位 置 上 : 
32 46 59 85 91 


否则 ，value 不 小 于 *first， 然 后 调 用 _unguarded linear_insert 方 法 。 这 个 方法 从 last-1 位 置 开始 ， 
并 一 直 将 项 向 上 移动 ， 直到 到 达 value 对 应 的 位 置 。 下 面 是 _ linear_insert 和 unguarded_linear 
_insert 方 法 的 代码 : 


template <class RandomAccesslterator class T> 
inline void — linear insert(RandomAccesslterator first, 
RandomAccessiterator last, T") 
z 
. T value = *last; 
if (value « *first) ( 

Copy. backward(first, last, last + 1); 
“first = value; 
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} 
else 
. unguarded linear insert(last, value); 


} 


template <class RandomAccesslterator, class T> 
void | unguarded linear insert(RandomAccesslterator last, T value) 
{ 
RandomAccessiterator next = last; 
--next; 
while (value « *next) 
{ 
"last = "next; 
last = next--; 
} 
*last = value; 


} 


无 防护 (unguarded) 意味 着 不 需要 尝试 就 能 保证 while 循 环 最 终 会 结束 。 这 个 结束 保 
证 来 自 于 _linear_insert 中 的 放 语 句 。 因 此 这 个 if 语句 的 目的 是 使 得 while 条 件 避 免 额 外 的 
nexti=first-1 而 试 。 这 种 复杂 却 极 有 效 的 代码 是 惠普 实现 的 特点 ， 而 且 其 他 的 实现 都 是 以 此 为 
基础 的 。 

插入 排序 举例 ”下面 是 对 __insertion_sort 中 for 循 环 的 五 次 迭代 的 跟踪 ， 包 括 While 循 环 检 
代 。i 位 置 上 的 项 用 黑体 表示 ， 而 且 每 次 运 代 后 从 first 到 i 之 间 的 项 都 用 下 划 线 表示 。 


tor, ŽI 
59 46 32 80 46 55 87 43 70 81 
59 59 32 80 46 55 87 43 70 81 


46 59 32 80 46 55 87 43 70 81 
torf, 442 


46 59 32 80 46 55 87 43 70 81 
46 59 59 80 46 55 87 43 70 81 
46 46 59 80 46 55 87 43 70 81 
32 46 59 80 46 55 87 43 70 81 


for 循 环 ， 和 迭代 


32 46 59 80 46 55 87 43 70 81 
32 46 59 80 46 55 87 43 70 81 


for 御 环 ， 和 迭代 4 

32 46 59 80 46 55 87 43 70 81 
32 46 59 80 80 55 87 43 70 81 
32 46 59 59 80 55 87 43 70 81 
32 46 46 59 80 55 87 43 70 81 


form, 445 
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32 46 46 59 80 55 87 43 70 81 
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32 46 46 59 80 80 87 43 70 81 
32 46 46 59 59 80 87 43 70 81 
32 46 46 55 59 80 87 43 70 81 


插入 排序 分 析 令 n 为 从 first (包括 在 内 ) 到 last (不 包括 在 内 ) 之 间 的 项 的 数量 。 
_ insertion_sort 中 的 for 循 环 总 是 执行 恰好 -1 次 。 如 果 容 器 开始 时 是 递增 顺序 的 ， 那 么 


_linear_insert 中 while 循 环 的 友 代 次 数 将 是 0。 因 此 总 的 友 代 次 数 将 是 六 1， 即 和 zx 成 线性 关系 。 


宽松 扩 儿 说 ， 可 以 说 如 有 果 容 器 开始 时 “几乎 ”是 递增 顺序 的 ， 将 不 会 有 很 多 的 内 部 循环 迹 
代 ; 那么 总 的 旬 代 次 数 仍 和 "成 线性 关系 。 

另 一 方面 ， 假 设 容器 开始 时 是 递减 顺序 的 ， 像 

92 85 71 55 42 23 
那么 在 for 循 环 的 第 一 次 迭代 中 将 有 while 循 环 的 一 次 迭代 一 一 打开 85 的 位 置 。 在 for 循 环 的 第 
二 次 返 代 中 ,， 将 有 while 循 环 的 两 次 迭代 一 一 打开 71 的 位 置 。 在 for 循 环 的 第 三 次 、 第 四 次 和 
第 五 次 碗 代 中 ， 将 分 别 有 while 循 环 的 三 次 、 四 次 和 五 次 迭代 。 一 般 而 言 ， 如 果 容 器 是 递减 顺 
序 的 ， 那 么 while 循 环 的 友 代 次 数 将 是 : 


n-l 
12434 ...t(n-2)*(n-1 2 Y k-n(n-1)/2 


也 就 是 说 ，worstTime(n) 和 n 成 平方 关系 。 在 平均 情况 下 (见习 题 12.7) 将 有 约 /ia2/4 次 
whilefüzZr0ikEfC. AitbaverageTime(n) ty Fn ey KA. 

质 入 排序 的 averageTime(n) 和 nn 成 平方 关系 。 

插入 排序 是 稳定 的 ， 因 为 如 果 value=*next， 那 么 while 循 环 停止 ， 然 后 value 被 插入 到 
next+1 位 置 。 通 过 从 i 开始 “向 下 审查 ”而 不 是 从 first 开 始 “ 向 上 审查 ”， 在 容器 已 经 有 序 时 将 


“获得 最 好 的 时 间 性 能 ， 当 容器 近似 有 序 时 也 将 获得 很 好 的 时 间 性 能 。 在 12.3.4 节 中 将 利用 这 个 


性 能 。 
12.2 排序 能 有 多 快 


使 用 插入 排序 法 排序 一 个 支持 随机 访问 迭代 器 的 容器 ， 它 的 worstTime(n) 和 n 成 平方 关系 。 
在 考虑 一 些 更 快 的 排序 方法 之 前 ， 让 我 们 花 少 许 时 间 先 看 一 下 还 能 做 多 少 改进 。 用 来 进行 这 
个 分 析 的 工具 是 决策 树 。 决 策 树 是 一 个 二 叉 树 ， 其 中 每 个 非 叶 节点 代表 两 项 之 间 的 比较 ， 而 
每 个 树叶 则 表示 这 些 项 的 一 个 排序 序列 。 例 如 ， 图 12-1 显 示 了 应 用 插入 排序 的 一 个 决策 树 ， 
其 中 即将 被 排序 的 项 存储 在 变量 a,、a, 和 as 中 。 | 

对 即将 排序 的 项 的 每 一 种 置换 ， 决 策 树 必须 有 一 个 树叶 与 之 对 应 S 。n 个 项 的 置换 总 数量 
尽 n!， 因 此 如 采 排 序 n 个 项 ， 那 么 相应 的 决策 树 必 须 有 nt! 个 树叶 。 根 据 二 又 树 定理 ， 任 何 非 空 
二 又 树 ! 中 的 树叶 数量 都 < 2w*%。 因 此 ， 对 排序 n 个 项 的 决策 树 1， 

n! < reso 
两 边 取 对 数 ， 得 到 
| height(t) > log,n! 


O 为 了 简化 ， 假 设 排序 方法 没有 做 任何 元 余 的 比较 。 
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换 句 话说 ， 对 任何 基于 比较 的 排序 而 言 ， 必 定 有 一 个 树叶 的 深度 至 少 为 logzn!。 在 决策 树 的 
上 下 文中 ， 这 意味 着 必定 存在 一 种 项 的 排列 ， 对 它 的 排序 需要 至 少 logzn! 次 比较 。 因 此 对 大 
于 比较 的 排序 ，worstTime(n) > logn!。 根 据 习 题 12.8，O(logn!) = O(nlogn)。 这 说 明 ，、 不 严 
格 地 讲 : l 


基于 比较 的 排序 的 worstTime(m) 不 小 于 O(nlogn), | 


al <a2? 
是 f 
a2 <a3? al <a3? 
a1 a2 a3 al <a3? a2 a1 a3 a2 <a3? 
al * X, a2 a2 N, al 


图 12-1 通过 播 入 排序 法 排序 三 个 项 的 决策 树 


还 可 以 进 一 步 深入 : 任何 基于 比较 的 排序 方法 的 averageTime(m) 不 小 于 O(nlogn)。 为 了 得 
到 这 个 结果 ， 假 设 t 是 一 个 排序 n 个 项 的 决策 树 。 那 么 有 ni! 个 树叶 。 所 有 n! 种 置换 中 ， 排 序 n 项 
的 平均 比较 次数 是 总 比较 次 数 除 以 nx!， 也 就 是 E(1)/n!。 根 据 第 8 章 的 外 部 路 径 定 理 ，E(1) > 
(n!/2)floor(log,n!). FAL sl: 
averageTime(n) > 平均 比较 次 数 
=E(t)/n! 
2 (n!/2)floor(log,n!)/n! 
=(1/2)floor(log,n!) 


因为 floor(logzn!1)< logzn!， 所 以 floor(logsn!) 是 O(logn!)。 根 据 习题 12.8， 
O(logn!)=O(nlogn)。 可 以 断定 floor(logsn!) 是 O(nlogn)。 将 这 个 结果 代入 averageTime 中 ， 得 到 


基于 比较 的 排序 的 averageTime(n) 不 小 于 O(nlogn)。 | 


对 任何 基于 比较 的 排序 ， ge RworstTime(n)X O(nlogn), AZ averageTime(n)4t, X 
O(nlogn), 

3589. XXI HESGEAGEGE RE AG. 本 章 中 剩余 的 每 个 算法 的 averageTime(m) 都 是 
O(nlogn)。 实 际 上 上 上， 下 面 三 个 排序 算法 的 worstTime(n) 也 只 是 O(nlogn)。 可 以 利用 这 个 事实 证 
明 averageTime(n) 必 定 也 是 O(nlogn)。 为 什么 ?假设 有 一 个 排序 算法 ， 它 的 worstTime(n) 是 
O(nlogn); 那么 averageTime(n) 肯 定 不 会 比 0(nlogn) 差 。 但 是 根据 平均 时 间 估 算 ， 
averageTime(n) 也 不 能 比 O(nlogn) 快 。 因 此 可 以 得 出 结论 ， 如 果 一 个 排序 算法 的 worstTime(n) 
是 O(nlogn)， 那 么 EffjaverageTime(n)44 定 也 是 O(nlogn)。 
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12.3 快速 排序 


在 12.3.1 到 12.3.4 节 中 ， 将 考察 四 个 averageTime(m) 仅 为 O(nlog 站 的 排序 算法 。 其 中 三 个 算 
法 的 worstTime(n) 也 是 O(nlogn)， 而 另 一 个 的 worstTime(n) 是 O(nm?)。 最 奇怪 的 是 最 后 一 个 算法 ， 
称 作 快速 排序 ， 它 往往 被 看 作 是 综合 效率 最 高 的 排序 ! 快速 排序 在 最 坏 情 况 下 的 性 能 很 差 ， 
但 是 在 平均 情况 下 的 运行 时 间 和 速度 性 能 是 很 多 方法 中 最 好 的 。 在 实验 27 中 将 证 明 这 一 性 能 。 
先 从 基于 第 10 意 的 multiset 类 的 排序 算法 开始 。 


12.3.1 树 排序 


即将 被 排序 的 项 是 一 个 接 一 个 地 插入 到 一 个 初始 为 空 的 multiset 容 器 中 的 。 这 就 是 树 排 


- 序 ， 因 为 最 困难 的 工作 是 在 multiset 类 的 insert 方 法 中 完成 的 ， 或 者 说 是 rb_tree 类 中 的 insert 


方法 更 为 合适 。 通 用 型 算法 tree_sort 不 是 标准 模板 库 的 一 部 分 ， 它 是 完成 实际 工作 的 函数 的 
包装 器 。 
template<class Forwardlterator> 
void tree_sort (Forwardlterator first, Forwarditerator last) 
{ 
if (first != last) . 


tree_sort_aux (first, last, *first); 
) // tree sort d: 


Ail Bo ER Be tree_sort_auxh =P ZB ERA AA. ix APERIRE sez ES HT 
需 的 。 下 面 是 tree_sort_aux 的 定义 : 


template<class Forwardlterator, class T> 
void tree sort aux (Forwardlterator first, Forwardlterator last, T) 


{ 


multiset< T, less« T > > tree_set: 

Forwarditerator itr; 

for (itr = first; itr != last; itr+ +) 

tree_set.insert (itr); 

copy (tree set.begin( ), tree set.end( ), first); 
| 
例如 ， 要 在 一 个 vector 容 器 v 中 应 用 树 排序 ， 应 使 用 
tree_sort(v.begin(), v.end()); 
树 排序 举例 ”人 先 给 出 项 的 初始 集合 ， 然 后 通过 逐个 将 这 些 项 插入 一 个 初始 为 空 的 multiset 

容器 ， 构 造 红 黑 树 《 假 设 multiset 类 是 用 一 个 红 黑 树 实现 的 )。 原 始 顺 序 的 项 是 : 

59 46 32 80 46 55 87 43 70 81 | | 


得 到 的 红 黑 树 是 : 
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46 80 
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32 46 70 87 
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43 55 &] 


PR FHL FS DL BU RAY es nn o 

树 排 序 分 析 ”对 i 二 1, 2, .… , n-1， 插 入 第 i 项 需要 至 多 log;i 次 克 代 。 如 下 插入 第 i 项 之 后 需要 
重 构 红 黑 树 ， 那 么 至 多 需要 (log2i)/2 次 迄 代 (回忆 第 10 章 红 潜 树 插入 的 情况 2 中 ， 用 x 的 祖父 赫 
换 了 x)。 这 个 最 坏 情况 下 的 总 迭代 次 数 是 : 


15> log, i < sy, log, n=1.5nlog, n 


树 排 序 是 快速 而 稳定 的 ， 但 空间 需求 与 4 成 线性 关系 。 

因此 树 排序 的 worstTime(n) 是 O(nlogn)， 而 且 根 据 12.2 节 里 的 讨论 ，O(nlogn) 一 定 是 
worstTime(n) 的 最 小 上 界 。 那 么 averageTime(n) 又 怎么 样 呢 ?9 由 于 averageTime(n) < 
worstTime(n)， 所 LLaverageTime(n) 是 O(nlogn)。 根 据 12.2 节 的 结论 ， 同 理 可 得 O(nlogn) 也 一 定 
是 averageTime(n) 的 最 小 上 界 。 i 

树 排序 需要 创建 4 项 的 多 集合 ， 因 此 worstSpace(n) 和 n 成 线性 关系 。 树 排序 是 稳定 的 ， 因 
为 如 末 即 将 插入 的 一 项 y 等 于 红 黑 树 中 已 经 存在 的 一 项 +， 那么 y 将 被 插入 到 x 的 右 子 树 中 。 从 
那 时 起 的 任何 旋转 ，y 都 将 被 看 作 好 像 是 x 小 于 y， 因 此 在 所 有 前 向 迭代 中 x 将 在 y 之 前 出 现 。 


12.3.2 HHF 


堆 排 序 方法 是 J.W.J.Williams (1964) 发 明 的 。 给 定 一 个 支持 随机 访问 迭代 器 的 容器 c， 堆 
排序 将 进行 以 下 两 步 处 理 : 

make_heap(c.begin(), c.end()); /使 用 运算 符 < 进 行 比较 

sort_heap(c.begin(), c.end()); 

我 们 在 第 11 章 中 已 经 了 解 了 make_heap 算 法 。sort_heap 算 法 是 相当 简单 的 ， 因 为 困难 的 工 
作 都 由 pop_heap 方 法 完成 了 : 

// 前 置 条 件 : 容器 中 从 first (包括 在 内 ) llast (不 包括 在 内 ) 之 间 的 项 构成 


If 了 一 个 堆 ， 
IARR: 容器 中 从 first (包括 在 内 ) Blast (不 包括 在 内 ) 之 间 的 项 以 


H 升序 排 烈 。worstTime(n) 是 O(nlogn)。 
void sort_heap(RandomAccesslterator first, RandomAccessiterator last) 
( 


while(last - first >1) 


pop heapffirst, last--);// 使 用 运算 符 < 进 行 比较 
}//sort_heap 


J> 
~ 
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堆 排 序 举 例如 果 照 例 使 用 10 个 项 的 集合 ， 那 么 执行 完 make_heap 算 法 之 后 ， 将 得 到 下 面 
485| KIHE: 


81 59 


A / 
43 70 46 


在 sort_heap 调 用 中 ， 反 复 弹 出 根 项 并 将 它 播 人 容器 尾 ， 因 此 在 10 次 迭代 之 后 得 到 下 面 的 
完全 二 又 树 ， 而 不 再 是 一 个 堆 : 


80 81 87 


在 容 磺 中 ， 项 的 序列 将 是 按 升序 排列 的 

堆 排序 分 析 — 堆 排 序 分 析 依 赖 于 make_heap 和 pop_heap 算 法 的 分 析 。 从 第 11 章 最 后 我 们 了 
解 到 make_heap 的 worstTime(n) 只 是 O(n)。 在 sort_heap 中 ,调用 了 pop_heap 算 法 n 次 。 第 一 次 这 
样 的 调用 需要 不 超过 2logwn 次 迭代 。 使 用 2 这 个 因子 是 因为 必须 沿 着 所 有 到 树叶 的 路 径 找 到 -一 
个 空间 ， 随 后 将 沿 着 所 有 的 路 径 返 回 根 ， 将 最 后 一 项 插入 。 第 二 个 调用 需要 不 超过 21og,(n-1) 
TRIB lB 8 — 1 VEL RET ERE KIA. RR — IK pop heapAHAR 833. th 
就 是 说 ， 在 最 坏 情 况 下 ， 和 迭代 的 总 次 数 是 : 


2¥ log, i 
il 


剩 下 的 分 析 和 树 排序 相同 : worstTime(n) 是 O(nlogn)， averageTime(n) 也 是 O(nlogn)， 并 且 这 些 
都 古 最 小 上 界 。 由 于 堆 排序 是 一 个 本 地 (in-place) 排序 ， 所 以 worstSpace(n) 是 常数 。 
推 排序 是 快速 的 不 稳定 的 本 地 排序 。 
堆 排序 不 是 一 个 稳定 的 排序 方法 。 例 如 ， 概 没 vector 对 象 vec 由 下 面 的 姓名 和 测验 成 绩 组 
486| 成， 测验 成 绩 高 的 优先 级 别 高 : 
“Jones”,85 "Smith", 85 


make_heap 调 用 将 保留 vec 不 恋 ， 因为 Smith 的 优先 级 不 大 于 Jone 的 优先 级 那么 sort_heap 将 把 
Jones ”存储 在 索引 11， 而 “Smith” 存 储 在 索引 0: 
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“Smith”, 85 “Jones”, 85 


12.3.3 归并 排序 


归并 排序 算法 是 作为 list 类 中 的 sort 方 法 提出 的 。 下 面 是 它 的 方法 接口 : 

RRR: 这 个 列表 根据 运算 符 < 按 照 升 序 排列 。worstTime(m) 是 Oniogn) 。 

void sort(); 

回忆 在 list 类 的 惠普 实现 中 ， 列 表 中 的 每 一 项 都 是 作为 节点 的 一 个 字段 存储 的 ， 在 这 个 节 
点 中 还 有 prev 和 next 指针 字段 。 几 乎 所 有 的 排序 工作 都 可 以 通过 操作 这 些 指 针 字 段 完成 ; 项 本 
身 是 不 需要 移动 的 。 在 研究 这 个 排序 方法 的 设计 之 前 ， 需 要 开发 一 个 辅助 方法 一 一 merge。 
protected 型 方法 merge 的 头 如 下 : 

/前 置 条 件 : 这 个 列表 和 x 都 是 根据 运算 符 < 排 序 的 列表 . 

HERRE: 这 个 列表 是 一 个 排序 列表 ， 它 包含 所 有 在 这 次 调用 前 属于 它 自身 或 是 

// 属于 x 的 项 。worstTime(n) 是 O(n)， 其 中 n 是 (调用 前 ) 这 个 调用 列表 对 象 

if 的 大 小 。 


void merge(list<T>& x); 
注意 例如 ， 如 果 一 个 项 在 调用 对 象 中 出 现 一 次 ， 在 x 中 出 现 两 次 ， 那么 在 调用 merge 
后 ， 孩 项 将 在 调用 对 象 中 出 现 三 次 。 | 

merge 方 法 的 惠普 的 定义 使 用 了 一 对 迭代 器 一 first1 和 first2。 最 初 ，firstl 位 于 调用 对 象 
的 第 一 个 节点 ，first2 位 于 x 中 的 第 一 个 节点 。 循 环 直到 耗 尽 一 个 列表 。 在 每 次 迭代 中 ， 如 果 
first2 的 项 小 于 first1 的 项 ， 就 通过 调整 指针 ， 将 first2 的 节点 转移 到 恰好 位 于 first1 的 节点 之 前 
并 改变 first2。 否 则 ， 就 改变 first1。 循 环 之 后 如 果 x 尚 未 耗 尽 ， 就 把 所 有 x 中 的 项 转移 到 调用 对 
象 的 尾部 。 最 后 为 调用 对 象 的 长 度 增添 上 x 的 长 讼 并 把 x 的 长 度 设 置 为 0。 

例如 ， 假 设 调用 是 lisi.merge(lis2)， 这 些 列表 包含 下 面 的 项 : 

lis1: 50, 60, 100, 110 | 


first 
lis2: 30, 40, 60, 80, 90, 150, 160, 180 


A 
oo 
~] 


first2 


因为 first2 的 项 30 小 于 first1 的 项 50， 所 以 将 first2 的 他 点 转移 ( 通过 指针 的 调整 ) 到 恰好 位 
于 first1 的 节点 之 前 并 修改 first2。 现 在 有 : 


lis: 30, 50, 60, 100, 110 


| first1 


lis2: 40, 60, 80, 90, 150, 160, 180 . 


first2 
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为 first2 的 项 仍 小 于 first1 的 项 ， 所 以 转移 first2 的 节点 并 修改 first2: 


list: 30, 40, 50, 60, 100, 110 


first 


lis2: 60, 80, 90, 150, 160, 180 


first2 
现在 first2 的 项 不 小 于 firsti 的 项 ， 因 此 只 需要 修改 first1: 


list: 30, 40, 50, 60, 100, 110 


first1 


lis2: 60, 80, 90, 150, 160, 180 


first2 


册 次 修改 first1 ， 因 为 first2 的 项 60 不 小 于 first1 的 项 (也 是 60): 


lis: 30, 40, 50, 60, 100, 110 


first 
lis2: 60, 80, 90, 150, 160, 180 


first2 


在 接 下 来 的 三 次 循环 迭代 中 ，first2 的 项 都 小 于 first1 的 项 ， 因 此 转移 first2 的 项 并 修改 
first2: 


lis1: 30, 40, 50, 60, 60, 80, 90, 100, 110 


first1 


lis2: 150, 160, 180 


first2 
在 下 面 的 两 次 迭代 中 ，first2 的 项 都 不 小 于 first1 的 项 ， 因 此 修改 first1: 


lis1: 30, 40, 50, 60, 60, 80, 90, 100, 110 


first 





A 床 J57 





lis2: 150, 160, 180 


first2 


现在 lis1 被 耗 尽 ， 于 是 将 list 对 象 lis2 中 所 有 剩余 的 节点 转移 (通过 指针 的 调整 ) 到 1list 对 象 
lis1 的 尾部 : 


lis: 30, 40, 50, 60, 60, 80, 90, 100, 110, 150, 160, 180 


first 


lis2: 


first2 
下 面 是 惠普 的 定义 : 


template <class T> 
void list<T>::merge(list<T>& x) 
{ 
iterator first = begin( ); 
iterator last1 = end( ); 
iterator first2 = x.begin( ); 
iterator last2 = x.end( ); 
while (firsti !— last1 && first2 != last2) 
if (*first2 < “first1) { 
iterator next = first2; 
transfer(first1, first2, + +next); 
first2 = next; 
} 
else 
+ +first1; 
if (first2 !— last2) transfer(iast1, first2, last2); 
length += x.length; 
x.length = 0; 
. 
为 了 今后 的 引用 ， 现 在 了 解 一 下 当 两 个 列表 包含 相同 数量 的 项 时 merge 的 情况 ， 在 这 种 情 
况 下 ，merge 是 很 精 糕 的 。 假 设 这 两 个 列表 的 项 是 交错 的 ， 例 如 ， 
lis1: 10, 30, 50, 70 | 
lis2: 20, 40, 60, 80 
在 这 种 情况 下 需要 七 次 循环 迭代 : (10 20), (20 30), (30 40), (40 50), (50 60), (60 
70)，(70 80)。 一 般 而 言 ， 如 果 每 个 列表 大 小 为 k:， 那 么 最 坏 情 况 下 的 总 循环 迭代 次 数 是 2k-1。 
使 用 merge 方 法 归并 子 列表 ， 列 表 类 的 sort 方 法 从 调用 对 象 的 头 开始 ， 并 重复 地 将 子 列表 
合并 成 双 倍 大 小 的 子 列表 。 大 小 为 1 的 子 列表 ( 它 是 自动 排序 的 ) 被 合并 成 大 小 为 2 的 排序 子 


A 
WO 
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列表 ; 大 小 为 2 的 排序 子 列表 被 合并 成 大 小 为 4 的 排序 子 列 表 ， 依 次 类 推 。 归 并 后 的 子 列表 存 
储 在 一 个 称 作 counter 的 列表 的 数组 中 。 对 每 个 从 0 到 63 的 ; 值 ，counter[i] 开 始 为 空 ， 随 后 可 能 
包含 0、2: 或 2# 个 项 。 只 要 counter[i] 包 含 了 2 个 项 ， 如 果 counter[i+1] 为 空 就 将 它们 转移 给 
counter[i-1], ， 耕 则 就 和 counter[i+1] 合 并 。 

归并 排序 举例 假设 消息 是 lis.sort0) 并 且 1lis 包 含 下 面 的 项 : 

lis: 30, 10, 20, 50, 40, 90, 25, 35, 15, 85, 60 

lis 中 的 第 一 个 节点 被 转移 到 一 个 名 为 carry 的 临时 表 中 ， 然 后 和 counter[0] 交 换 。 现 在 有 : 


lis: 10, 50, 20, 40, 90, 25, 35, 15, 85, 60 
carry: 
counter [0]: 30 


当 lis 中 的 下 一 个 项 转移 到 carry 中 时 ， 该 列表 和 counter[0] 归 并 ， 然 后 转移 到 counter[1]: 


lis: 50, 20, 40, 90, 25, 35, 15, 85, 60 
carry: 

counter [0]: 

counter [1]: 10, 30 


当 50 转 移 到 carry 中 时 ， 该 项 被 转移 到 counter[0]， 因 为 counter[0] 为 空 。 当 20 转 移 到 carry 中 时 ， 
该 项 和 50 进 行 归并 ，、 使 得 counter[0] 满 。 因 此 counter[0] 和 counter{1] 进 行 归并 : 


lis: 40, 90, 25, 35, 15, 85, 60 
carry: 

counter [Oj: 

counter [1]: 10, 20, 30, 50 


但 是 现在 counter[1] 已 满 ， 所 以 它 的 项 被 转移 到 counter[2]: 


lis: 40, 90, 25, 35, 15, 85, 60 
carry: 

counter [Oj: 

counter [1]: 

counter [2]: 10, 20, 30, 50 


在 归并 了 lis 中 的 下 面 四 项 之 后 ， counter[3] 包 含 了 原 表 中 的 前 八 项 上 且 以 升序 排列 。 当 归并 1lis 中 
的 最 后 三 项 时 ， 得 到 : 


lis: 

Carry: 

counter [0]: 60 

counter [1]: 15, 85 

counter [2]: 

counter [3]: 10, 20, 25, 30, 35, 40, 50, 90 


| Eri. Jkcounter[2] F €counter[0], 所 有 的 counter 列 表 被 归并 到 counter[3]， 然后 和 lis 进 
行 交 换 ， 因 此 最 终结 果 是 : 
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lis: 10,15,20,25,30,35,40,50,60,85,90 

carry 列 表 在 算法 中 扮演 了 一 个 重要 的 角色 ， SUN marie a 
列表 中 的 每 一 项 在 和 某 一 个 counter 列 表 归 并 或 交换 之 前 都 存储 在 carry 中 。 而 且 对 某 些 i， 
counter[i] 已 满 时 ， 就 把 counter[ij 和 一 个 空 的 carry 交 换 。 然 后 如 果 counter[i+1] 为 空 ， 就 只 " 
carryfücounter[i-1]221&; 否则 就 把 carry 和 counter[i+1] 归 并。 在 这 两 种 情况 下 ， carry 和 


counter[i] 都 是 空 
下 面 是 惠普 的 定义 : 
template <class T> 
void list<T>::sort( ) 


{ 
if (size( ) < 2) 
return; 
list<T> carry; 
list<T> counter[64]; 
int fill = 0; 
while (!empty( )) 
{ 
carry.splice(carry.begin( ), "this, begin( )); 
int i = O; 
while(i < fill && !counter{i].empty( )) 
{ 
counter{i].merge(carry): 
carry.swap(counterr[i 4- +]); 
} 
carry.swap(counter[i]); 
if (i == fill) 
+ fill; 
} 
for (int i = 1; i < fill; ++i) 
counter[i].merge(counter[i — 1]); 
swap(counterffill — 11); 


} 


归并 排序 分 析 list 类 的 sort 方 法 将 花费 多 长 时 间 ? 和 树 排序 以 及 堆 排序 一 样 ， 这 里 还 是 做 

一 个 最 坏 情况 下 的 分 析 来 了 解 worstTime(n) 和 averageTime(n)。 对 列表 中 每 对 连续 的 项 ， 

counter[0] 中 对 的 第 二 项 和 对 的 第 一 项 归并 。 这 样 的 n/2 次 归并 的 每 一 个 都 需要 merge 方 法 中 的 

一 次 循环 迭代 ， 因 此 对 归并 的 总 迭代 数量 是 mw2。 对 列表 中 每 四 个 连续 的 项 ，counterf1]j 中 每 四 

项 的 第 二 对 和 第 一 对 归并 ， 而 且 这 样 的 w4 次 归并 的 每 一 个 至 多 需要 merge 方 法 中 的 三 次 循环 
迭代 。 继 续 这 样 下 去 可 得 到 下 面 的 表 ， 其 中 三 floor(log:): 

——M——— MÀ 


从 carry 转 移 到 | 归并 次 数 ”每 次 归并 需要 的 和 迭代 
counter[0] n/2 1 
counter[1] l n/A 3 


counter[2] n/8 7 
eee 


rs 
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(2X) 
从 carry 转 移 到 归并 次 数 每 次 归并 需要 的 迭代 
counter[3] n/16 15 
counter[&-1 ] nik 2 一 ] 


在 表 的 每 一 行 上 ， 总 选 代 次 数 小 于 n。 行 的 数量 是 ik:， 也 就 是 floor(logzn)。 因 此 所 有 行 的 总 
磊 代数 量 小 于 nfloor(log;n)， 也 殊 是 O(nlogn)。 但 是 任何 基于 比较 的 排序 必定 需要 至 少 
O(nlogn) Rik te. AI AT CLO ez list2e t sort) KM worstTime(n)#O(nlogn), PRL 
averageTime(n) 也 是 O(nlogn)， 并 且 这 些 都 是 最 小 上 界 。 

空间 需求 怎么 样 呢 ? 从 有 n 项 的 列表 开始 ， 并 且 这 些 项 是 从 不 移动 的 一 一 所 有 的 “转移 ” 
都 使 用 指针 操作 而 不 是 拷贝 。 因 此 可 以 说 worstSpace(n) 是 常数 。 严 格 地 讲 ， 讨 论 归并 排序 的 





大 O 性 质 是 不 合适 的 ， 因 为 对 很 大 的 n 来 说 ,该 方法 将 失效 。 具体 地 说 ，counter 数 组 至 多 保存 


64 个 列表 和 2”“~1 个 项 。 而 从 实际 的 角度 来 说 ， 这 个 缺陷 不 太 可 能 产生 什么 不 好 的 结果 ， 因 为 
2 是 一 个 比 百 万 的 四 次 方 还 大 的 数 。 

归并 排序 是 一 个 快速 的 本 地 排序 ， 它 是 稳定 的 。 

要 证 明 归并 排序 是 稳定 的 ， 首 先 需 要 考察 merge 方 法 。 假 设 有 下 面 形式 的 消息 : 

lis1.merge(lis2) 

其 中 lis1 中 的 x1 和 lis2 中 的 x2 相 等 。 因 为 x2 不 小 于 x1， 所 以 x2 和 x1 的 比较 将 导致 在 merge 方 
法 中 增加 first1 迭 代 器 。 这 就 保证 了 当归 并 结束 时 xl 将 位 于 x2 之 前 。 

现在 假设 在 原来 的 列表 中 ，x 比 y 更 接近 列表 的 开头 ， 并 且 x 等 于 y。 当 y 被 转移 到 临时 表 
carry 里 时 ，x 已 经 在 counter[k] 里 ， 其 中 上 > 0。 如 果 k=0， 那 么 当 调 用 

counter[0].merge(carry); 

时 将 比较 x 和 y， 而 且 根 据 对 merge 的 分 析 可 知 x 将 位 于 y 之 前 。 否 则 ， 当 调用 

counter[k].merge(counter[k- 1]); | 


时 将 比较 x 和 y， 同 样 根 据 对 merge 的 分 析 可 知 x 将 位 于 y 之 前 。 综 上 所 述 归并 排序 是 稳定 的 。 
12.3.4 快速 排序 


一 种 最 有 效 且 应 用 最 广泛 的 排序 算法 是 快速 排序 ， 它 是 由 C.A.R.Hoare (1962) FEH. 
标准 模板 库 里 的 <algorithm> 中 的 通用 型 算法 sort 有 如 下 接口 : 

MARR: 容器 中 从 first 到 last-1 之 间 的 项 是 以 升序 排列 的 ， 

II average Time(n)#O(n log n), worstTime(n)f&O(n*n), 

template<class RandomAccessiterator> 

void sort(RandomAccesslterator first, RandomAccessiterator last); 

这 个 sort 版 本 假定 项 之 间 的 比较 使 用 的 是 operator<。 还 有 另 - -个 版 本 ， 它 的 第 三 个 参数 
起 一 个 用 来 比较 项 的 函数 对 象 。 

容器 可 以 是 数组 、 向 量 、 双 端 队列 或 是 某 些 支持 随机 访问 迭代 器 的 用 户 定义 的 容器 。 基 
本 上 ， 惠 普 的 sort 方 法 首先 将 从 first 到 last-1 之 间 的 项 分 隔 成 一 个 左 子 分 区 和 一 个 右 子 分 区 ， (E 
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得 左 子 分 区 中 的 每 一 项 都 小 于 等 于 右 子 分 区 中 的 每 一 项 。 最 后 ， 使 用 快速 排序 对 左 、 右 子 分 
区 排序 。 最 后 的 这 个 步骤 很 容易 用 两 个 递归 调用 完成 ， 因 此 这 里 将 着 重 关注 分 隔 阶段 。 
首先 ， 确 定 一 个 枢 轴 (pivot) 项 : 为 了 将 容器 分 成 两 段 ， 用 来 与 容器 中 其 他 项 进行 比较 
的 项 。 枢 轴 应 当选 择 三 个 项 一 一 *first、*(first+(last-first)/2) 和 和 *(ast-1) 一 一 的 中 值 号。 
快速 排序 的 分 隔 举 例 假设 试图 分 隔 下 面 的 容器 : 


72 56 28 101 47 16 34 19 27 18 92 45 61 39 


first fast 


注意 ， 因 为 last-first 是 14， 所 以 项 19 就 是 *(first+(last-firsty/2)。 枢 轴 是 39;， 也 就 是 72、19 
和 39 三 个 值 的 中 值 。 现 在 想 把 所 有 小 于 等 于 39 的 项 移动 到 左 子 分 区 ， 把 所 有 大 于 等 于 39 的 项 
移动 到 右 子 分 区 。 值 等 于 39 的 项 可 以 放 在 任 一 分 区 里 ， 并 且 这 两 个 子 分 区 的 大 小 不 一 定 相 同 。 

为 了 完成 这 个 分 隔 ， 使 用 了 一 个 while 循 环 ， 直 到 产生 return 。 在 这 个 循环 中 有 两 个 
while 循 环 。 第 一 个 内 部 循环 增加 first 直 到 *first > 枢 轴 。 然 后 last 减 1， 并 且 第 二 个 内 部 循环 将 
减少 last 直 到 *last < fh. nÆ first > last， 就 返回 first。 会 则 就 交换 first 和 last 上 的 项 ， 增加 
first 并 再 次 执行 外 部 循环 。 

在 这 个 例子 中 ， 因 为 72 是 first 中 的 项 ， 而 72 > 39， 所 以 第 一 个 内 部 循环 立即 停止 了 。 然 后 
last 减 1 并 进入 第 二 个 内 部 循环 。39 是 last 中 的 项 ， 因 为 39 < 39， 所 以 循环 也 立即 停止 。 当 交换 
72 和 39 并 增加 first 后 ， 有 : 


.39 56 28 101 47 16 34 19 27 18 92 45 6| 72 


1 


. first ae last 


由 于 56 > 39, 所 以 第 一 个 内 部 循环 又 一 一 次 马上 停止 。 然 后 last 减 1， 进 入 第 二 个 内 部 循环 。 
这 个 循环 迭代 三 次 ， 最 后 *1ast=18。 ”交换 并 增加 first 之 后 4 得 到 


39 18 28.101 47 16 34 19 27 56 92 45 61 72 


— first last 


在 接 下 来 的 两 次 外 部 循环 迭代 中 ，101 和 27 交 换 ，47 和 19 交 换 。 现 在 有 : 


39 18 28 27 19 16 34 47 101 56 92 45 61 72 


first last 


TESS ERR ART PAR, B—PS ABBE, laste cb, 第 二 个 内 部 循环 马上 
停止 。 因 为 first > last， 所 以 外 部 循环 结束 并 返回 first。 分 隔 如 下 : 


虽 “ 三 个 值 的 中 值 是 一 个 中 间 的 值 ， 也 就 是 当 排序 这 三 个 值 时 位 于 中 间 位 置 的 数值 。 
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39 18 28 27 19 16 34 47 101 56 92 45 61 72 


last first 


左 子 分 区 由 项 39, 18, … , 34 组 成 ; 右 子 分 区 由 项 47, 101, ... , 72 组 成 。 注意 在 first 之 前 的 每 
一 项 都 < 39， 而 位 于 first 上 及 其 后 的 项 都 > 39。 使 用 快速 排序 对 左 子 分 区 进行 排序 ， 将 得 到 新 
的 first 和 1last 值 : 


39 18 28 27 19 16 34 47 


| 


first last 


注意 last 位 于 子 分 区 中 最 后 “项 的 下 一 项 。 枢 轴 是 34， 即 (39, 27, 34) 的 中 值 。 原 容器 
的 右 子 分 区 的 设置 是 : 


47 101 56 92 45 61 72 


| 


first last 


这 里 枢 轴 是 72， 即 (47, 92, 72) 的 中 值 。 在 习题 12.10 中 要 求 完成 这 个 第 二 层次 的 分 隔 。 
刚才 反 述 的 算法 称 作 _unguarded_partition。 下 面 是 _unguarded_partition 的 定义 : 


// 前 置 条 件 : first«last, 从 first 到 last-1 之 间 圣 少 有 项 x 和 项 y， 满足 


Il {pivot<x) 44K B (y«pivot) 3 B. 

// 后 置 条 件 : 对 于 任意 满足 first 的 原始 值 <=itr1 且 itr2<=last 的 原始 值 的 

I 迭代 器 itr1 和 itr2， 如 果 itr1<first 的 最 后 值 ， 那么 (pivot<*itr1) 

If 为 假 ， 如 果 itr2>=first 的 最 后 值 ， ABA (*itr2<pivot) AiR. worstTime(n) 
// fz O(n), 


template <class RandomAccessiterator, class T> 
RandomaAccesslterator ..unguarded partition(RandomAccesslterator first, 
RandomAccesslterator last, 


T pivot) 
{ 
while (1) 
{ 
while (“first < pivot) 
+ +first; 
--last; 
while (pivot < "last) 
--last; 


if (!(first < last)) 
return first; 
iter swapí(first, last); 
t +first; 
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现在 已 经 了 解 了 分 隔 是 如 何 完 成 的 ， 下 面 将 开发 高 层次 的 快速 排序 算法 。_quick_sort_ 
loop_aux 困 数 首先 求 出 枢 轴 ， 然 后 调用 _unguarded_partition 。__unguarded_partition 的 返回 值 
存储 在 RandomAccessIterator 对 象 cut 中 。 先 用 快速 排序 对 两 段 (first 到 cut-1 ，cut 到 last-1 ) 中 
较 小 的 一 段 排序 ， 然 后 再 排序 较 大 的 一 段 。 先 选择 较 小 一 段 的 原因 是 它 能 够 被 分 隔 的 次 数 少 
于 较 大 的 段 ， 因 此 任何 时 候 堆 栈 中 活动 记录 的 数量 都 在 减少 。 

枢 轴 的 选择 、_unguarded_partition 的 调用 以 及 较 小 段 的 快速 排序 是 在 一 个 while 循 环 中 
发 生 的 ， 循 环 将 不 区 运行 直到 1ast-first 小 于 等 于 某 一 阀 值 。 采 用 阅 值 的 目的 将 在 下 面 诠 释 。 现 
在 假设 阐 值 是 1， 因 此 只 要 从 first 到 last-1 之 间 的 段 中 有 至 少 两 项 ， 循 环 就 继续 下 去 。 下 面 是 完 
整 的 、quick_sort_loop_aux 算 法 : 


template <class RandomAccesslterator, class T> 
void quick sort loop aux(RandomAccesslterator first, 


RandomaAccesslterator last, T*) 


{ 


while (last — first > — stl threshold) 
{ 


RandomAccesslterator cut = — unguarded partition (first, last, 
T(__median(“first, *(first + (last — first)/2), *(last — 1))); 
if (cut — first >= last — cut) 


{ 
__quick_sort_loop(cut, last); 
last = cut; 


— quick sort loopífirst, cut); 
first — cut; 


} 


Hb A SS Br first last). quick sort. loop i 只 不 过 是 获得 项 *first 的 类 型 T， 然 后 调用 以 T 
为 模板 的 ._quick_sort_loop_aux。 下 面 是 、quick_sort_ioop 的 定义 : 


template <class RandomAccessiterator> _ 
inline void — quick sort loop(RandomAccesslterator first, 
RandomAccessiterator last) { 
—quick_sort_loop_aux(first, last, value type(first)); 


] 


快速 排序 分 析 分 析 快速 排序 的 性 能 ， 先 从 一 个 简单 的 假设 开始 ， 假定 常数 _stl_ threshold 
的 值 为 1。 也 就 是 说 ， 每 个 段 都 将 被 分 隔 ， 除 非 该 段 的 大 小 是 0 (A, 如 果 first=last) 或 者 1 
(如 果 first=last-1 ) 。 但 是 这 意味 着 排序 大 小 为 的 容器 将 需要 约 n 个 分 区 。 当 把 一 个 段 分 隔 成 两 
部 分 时 ， 由 于 每 个 项 都 和 枢 轴 进行 比较 ， 所 以 最 里 面 的 两 个 while 循 环 的 迭代 次 数 近似 等 干 段 
的 大 小 。 因 此 总 的 选 代 次 数 依赖 于 被 分 隔 的 段 的 大 小 。 


rm 
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观察 快速 排序 的 效果 可 知 ， 这 就 好 像 创建 了 一 个 假想 的 折 半 查找 树 ， 其 中 根 项 是 枢 轴 ， 
而 它 的 去 友子 树 分 别 是 左 段 和 右 段 。 例 如 ， 图 12-2 显 示 了 当 快速 排序 效率 最 高 时 导出 完全 折 
半 查 找 树 的 示例 ， 也 就 是 每 次 分 隔 都 将 段 分 成 两 个 同样 大 小 的 子 段 的 情况 。 如 果 项 原来 就 是 
按 顺 序 排 列 或 按 逆序 排列 的 ， 那 么 将 得 到 这 样 的 树 ， 因 为 这 时 *first、*(first+(last-firsb/2) 和 

497| “*(ast-1) 的 枢 轴 将 总 是 *(first+(last-first)/2)。 

因为 每 次 分 隔 都 将 段 分 成 两 个 相等 的 部 分 ， 所 以 图 12-2 的 树 中 分 隔 层次 的 数量 就 等 于 它 
的 高 度 floordog:7); 即 2。 和 迭代 的 总 数量 约 是 14 (也 就 是 n*floor(logsn)， 其 中 n=7)。 对 大 小 是 
n 的 容器 ， 如 果 每 次 分 隔 都 得 到 大 小 相同 的 子 分 区 ， 那 么 分 隔 层 次 的 数量 近似 为 logm， 因 此 总 
的 选 代 次 数 就 近似 是 mogm。 

对 比 图 12-2 中 的 树 与 图 12-3 中 的 树 。 图 12-3 中 的 树 表 示 了 下 面 的 项 序列 产生 的 分 隔 : 

20 30 40 10 80 50 60 70 

每 次 迭代 中 ， 枢 轴 是 次 小 项 或 者 次 大 项 时 将 出 现 最 坏 的 情况 。 也 就 是 上 面 的 序列 产生 的 
图 12-3 所 示 的 树 。 

80 


PD 


50 


ANON 


20 60 90 124 
图 12-2 通过 重复 分 隔 包 含 七 个 项 的 随机 访问 容器 ， 得 到 
同等 大 小 的 段 ， 由 此 创建 的 假想 的 折 半 查找 树 
~、 
50 80 
0 


3 60 


\ 


40 
图 12-3 最 坏 情况 的 分 隔 : 每 次 分 隔 只 能 将 快速 排序 的 段 的 大 小 减 1， 
相应 的 《假想 的 ) 折 半 查找 树 在 每 个 非 根 县 次 上 只 有 一 个 树叶 


在 最 坏 情 况 中 ， 第 一 个 分 隔 需 要 约 n 次 迭代 并 产生 一 个 大 小 为 4- 1 的 段 ( 另 一 个 是 大 小 为 | 
的 段 )。 当 分 隔 这 个 大 小 为 x- 1 的 段 时 需要 约 n- 1 次 迭代 ， 并 产生 一 个 大 小 为 -2 的 段 。 持 续 这 
个 过 程 ， 直 到 最 后 产生 的 较 大 的 子 分 区 大 小 为 1。 总 的 迭代 次 数 近似 为 n+(n-1)+(n-2)+...+1. 
共计 (n+l)/2 次 。 由 此 可 以 推断 worstTime(o) 和 m 成 平方 关系 。 顺 带 提 一 下 ， 这 个 最 坏 情况 并 不 
是 在 每 天 运行 中 都 可 能 遇 到 的 。 在 习题 12.5 中 将 要 求 开发 一 个 算法 以 产生 这 种 最 坏 情 况 。 
现在 估算 快速 排序 的 平均 时 间 。 平均 时 间 花 费 由 容器 中 项 的 全 部 nl! 个 初始 排列 控制 。 假 
想 折 半 查找 树 的 每 个 层次 都 代表 着 分 隔 ， 大 约 需要 zz 次 迭代 ， 层 的 数量 是 这 个 折 半 查找 树 的 乎 





I 
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也 就 是 说 averageTime(n) 是 O(nlogn)。 根据 12.2 市 中 关于 排序 究 竞 能 有 多 快 的 结论 可 知 ， 这 一 - 
定 也 是 最 小 上 界 。 

阅 值 “分 隔 有 两 个 或 三 个 项 的 段 比 直接 对 它们 排序 更 费时 。 正 因 如 此 ， 只 有 当 一 个 段 的 大 
小 大 于 其 常数 _str_threshold 时 才 在 其 中 执行 快速 排序 。 在 惠普 的 实现 里 ， 这 个 常数 的 值 是 16， 
不 过 最 适当 的 值 依 赖 于 机 器 。 

当 __quick_sort_loop_aux 执 行 结束 时 ， 容 器 中 从 first 到 last-1 之 间 的 段 不 会 完 侈 有 序 ， 而 是 
“ 半 有 序 的 "。 也 就 是 说 ， 从 first 到 last-1 之 间 的 项 将 由 k 个 段 组 成 ,，k 是 正 整 数 : 

first&litr,- 1, itr, Sjitr,- 1, ,itr¥)itrs— 1 ，..., itr, _, slast—1 

对 任何 1 和 k-1 之 间 的 j 而 言 ， 所 有 有 段 中 的 项 都 小 于 等 于 段 守 1 中 的 项 。 每 个 段 的 大 小 至 多 是 


. Str threshold, 


平均 情况 下 ， 获 得 这 些 半 有 序 的 段 的 时 间 花 费 是 O(zlogm) ， 因 为 大 约 有 log:(z/_stl_ 


threshold) 个 分 隔 层 次 ， 每 个 层次 有 nn 次 迭代 。 

不 过 ”， 读 者 可 能 质疑 ，“ 在 平均 情况 下 的 时 间 花 费 仍 为 O(nlogn) 而 且 其 至 没有 得 到 -个 
有 序 的 列表 ? 目的 是 什么 ?”” 当 考察 运行 时 间 时 将 了 解 到 ， 目 的 就 是 使 用 阔 值 比 不 使 用 它 要 
快 一 些 ， 因 为 快速 排序 不 适合 小 的 段 。 

要 完成 排序 ， 将 播 入 排序 应 用 到 从 first 到 last-1 之 间 的 所 有 的 项 上 。 回 亿 一 下 ， 当 容器 有 序 
或 近似 有 序 时 ， 该 算法 的 时 间 花 费 和 xz 成 线性 关系 。 特 别 是 因为 每 个 半 有 序 的 段 的 大 小 小 于 等 
于 stL_threshold， 所 以 排序 这 样 的 段 时 播 入 排序 执行 的 循环 迭代 次 数 近似 为 “stl_thresholdz/4. 
这 里 最 多 有 mn 个 段 ， 因 此 采用 这 样 的 方式 排序 first 到 last-1 之 间 的 项 最 多 需要 nr stl_threshold?/4 
次 循环 迭代 ， 又 因为 _stL_threshold 是 一 个 常数 ， 所 以 它 和 "是 成 线性 关系 的 。 

因而 这 个 改进 版 本 的 快速 排序 的 averageTime(n) 仍 旧 是 O(nlogn)， 但 倘若 把 _stl_threshold 
设置 为 1， 那 么 实际 的 运行 时 间 性 能 要 快 些 。 广 意 worstTime(n) 将 仍 和 nn 成 平方 关系 。 

快速 排序 的 空间 需求 依赖 于 递归 调用 的 数量 。 在 最 坏 情 况 下 ， 递 归 调用 的 数量 和 mn 成 线性 
关系 ， 因 此 worstSpace(n) 和 nn 成 线性 关系 。 在 平均 情况 下 ， 递 归 调 用 的 数量 和 n 成 对 数 关系 ， 
因此 averageSpace(n) 和 nn 成 对 数 关系 。 

快速 排序 是 不 稳定 的 。 比 如 ， 假 设 开始 时 的 序列 如 下 : 

010102345678910111213145615 


枢 轴 是 8。 在 第 一 次 分 隔 中 ， 位 于 索引 1 上 的 10 和 索引 17 上 的 6 交换 ， 索引 2 上 的 10 和 索引 
16 上 的 S$ 交 换 。 现在 这 两 个 10 的 相对 位 置 就 和 原先 的 不 l, 并 且 这 样 的 结果 将 保持 下 去 (回忆 
— b. 插入 排序 是 稳定 的 )。 

快速 排序 在 平均 情况 下 是 非常 快 的 ， 而 在 最 坏 情 况 下 则 很 慢 ， AGAR, 并 且 也 不 
是 本 地 的 排序 方法 。 | l 

总 之 ， 快 速 排序 最 坏 情 况 下 的 时 间 花 费 是 非常 糟糕 的 ， 它 的 空间 需要 也 不 是 常数 ， 并 且 
不 是 一 个 稳定 的 排序 。 快 速 排序 的 吸引 人 之 处 就 在 于 平均 情况 下 的 快速 性 : 在 实验 27 中 将 证 
实 这 一 点 。 


12.3.5 分 治 法 算法 
快速 排序 是 一 个 分 治 法 算法 。 每 个 分 治 法 算法 都 具备 下 列 特性 ; 
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© 递归 调 用 是 独立 且 可 以 并 行 执行 的 。 

。 通 过 结合 递归 调用 的 结果 可 以 实现 原先 的 任务 。 

快速 排序 是 一 个 分 治 法 算法 。 

在 快速 排序 里 ， 左 右 子 分 区 的 分 隔 可 以 分 别 完成 ， 然 后 用 快速 排序 对 左右 子 分 区 排序 。 
当 所 有 子 分 区 都 用 快速 排序 排列 好 顺序 之 后 ， 调 用 插入 排序 将 项 按 顺 序 插入 原 容 粥 。 因 此 祷 
足 分 治 法 算法 的 需要 。 

分 治 法 算法 和 一 个 任意 的 包含 两 个 递归 调用 的 递归 算法 有 什么 不 同 呢 ? 区 别 是 一 个 任意 
的 递归 算法 中 的 递归 调用 不 需要 是 独立 的 。 例 如 ， 在 汉 诺 塔 问题 中 ，n~1 个 盘子 必须 在 这 些 同 
样 的 na-1 个 盘子 从 临时 杆 移 动 到 目的 地 之 前 ， 先 从 源 移 动 到 临时 杆 上 。 注 意 实验 9 中 原先 的 非 
波 纳 问 了 消 数 就 是 一 个 分 治 法 算法 ， 但 是 这 两 个 独立 的 尔 数 调用 暗示 了 函数 总 体 的 无 效率 性 。 

实验 27 对 本 章 中 所 有 快 的 排序 算法 进行 了 运行 时 间 实 验 。 


实验 27: 排序 算法 的 运行 时 间 (所 有 实验 都 是 可 选 的 ) 





本 章 包 含 了 五 个 基于 比较 的 排序 方法 。 插 入 排序 只 能 用 于 支持 随机 访问 迭代 器 的 容器 ( 像 
数组 、 向 量 和 双 端 队列 )， 并 且 把 它 应 用 在 升序 或 接近 升序 排列 的 容器 上 只 花费 n 的 线性 时 间 。 
插入 排序 并 非 直 接应 用 ( 它 的 averageTime(n) 和 n 成 平方 关系 )， 它 是 通用 型 算法 sort 的 一 部 分 。 

对 基于 比较 的 排序 而 言 ，worstTime(n) 不 会 快 于 O(nlogn)， 并 且 averageTime(n) 也 不 快 于 
O(nlogn). 

树 排 序 算法 反复 地 将 项 播 人 一 个 multiset 容 器 ; worstTime(n) 是 O(nlogn)。sort_heap 算 法 的 
worstTime(n) 也 是 O(nlogn)。 归 并 排序 是 list 类 的 排序 方法 , 它 在 最 坏 情况 下 的 时 间 花 费 也 是 O(nlogn)。 
因此 、 所 有 这 三 种 排序 算法 的 averageTime(n) 都 是 O(nlogn)， 并 且 所 有 这 些 上 界 都 是 最 小 的 。 

快速 排序 一 一 通用 型 sort 算 法 一 一 只 能 用 于 支持 随机 访问 迭代 器 的 容器 ， 像 数组 、 向 量 和 
双 端 队列 。 算 法 开始 时 将 从 first 到 last-1 之 间 的 段 分 成 左 子 段 和 右 子 段 ， 使 得 左 子 段 中 的 每 一 
项 小 于 等 于 布 子 段 中 的 每 一 项 。 左 右 子 段 自 身 再 进行 分 隔 ， 只 要 有 一 个 段 的 大 小 大 于 某 一 阅 
E (一 般 是 16) 就 持续 这 个 过 程 。 最 后 ， 调 用 一 种 插入 排序 完成 整体 的 排序 。 尽 管 sort 在 最 坏 
情况 下 的 时 间 花 费 是 平方 关系 的 ， 但 是 averageTime(n) 也 只 是 O(nlogn)。 

表 12-1 对 本 章 中 提 到 的 排序 算法 进行 了 简单 的 归纳 总 结 。 


表 12-1 排序 算法 的 重要 特点 





排序 算法 averageTime(n) worstTime(n) 运行 时 间 排 名 稳定 吗 ? 
插入 排序 O(n’) O(n’) 5 是 
树 排 序 O(nlogn) O(nlogn) 3 是 
SE HE FF O(nlogn) O(nlogn) 2 da 
归并 排序 O(nlogn) O(nlogn) 4 是 
快速 排序 O(nlogn) O(n?) i a 


运行 时 间 排名 是 根据 排序 n 个 随机 素数 所 花 殴 的 时 间 确 定 的 。 详 情 参 阅 实 验 27。 
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习题 
12.1 使 用 下 面 的 数值 序列 跟踪 表 12-1 中 给 出 的 每 种 排序 方法 的 执行 情况 : 
10 90 45 82 71 96 82 50 33 43 67 


FALE ARE RU Sd f 501 
122 a. 针对 每 种 排序 算法 重新 安排 习题 12.1 中 的 数值 序列 ， 使 得 用 最 少 的 比较 次 数 排序 
容器 。 
b. 针对 每 种 排序 算法 重新 安排 习题 12.1 中 的 数值 序列 ， 使 得 用 最 多 的 比较 次 数 排序 
Za. 
12.3 假设 通过 将 项 插入 一 个 初始 为 空 的 BinSearchTree 容 器 来 进行 排序 ， 估 算 worstTime(n) 
RaverageTime(n). 


12.4 本 章 的 哪些 排序 算法 的 averageTime(n) 和 worstTime(n) 的 大 O 估 算 相 同 ? 
12.5 开发 一 个 算法 排列 容器 中 0...n- 1 的 整数 ， 使 得 快速 排序 需要 平方 时 间 才 能 排序 容器 。 . 
提示 为 了 获得 最 坏 的 时 间 花 费 ， 每 次 分 隔 都 应当 产 生 一 个 只 包 禽 一 个 项 的 段 ， 段 中 
或 者 包含 最 小 的 项 ， 或 者 包含 最 大 的 项 。 一 种 方法 是 将 项 按 顺 序 排 列 ， 但 是 中 间 的 
两 项 是 最 小 的 和 最 大 的 项 。 例 如 ， 如 果 数 值 是 0...9， 那 么 就 从 
1, 2, 3, 4, 0, 9, 5, 6, 7, 8 
开始 。 注意 ， 执 行 每 次 分 隔 时 ， 枢 轴 或 者 是 次 小 项 ， 或 者 是 次 大 项 。 因 此 每 次 
分 隔 都 将 产生 一 个 大 小 是 1 的 段 。 
12.6 a. 假设 有 一 个 排序 算法 的 averageTime(n) 是 O(nlogn)， 并 假设 这 就 是 最 小 上 界 。 例 如 ， 
本 章 中 的 任 一 快 的 排序 都 将 满足 上 面 的 条 件 。 回忆 在 实验 16 中 ，runTime(n) 代 表 在 
一 个 特定 计算 机 系统 中 算法 实现 排序 n 个 随机 整数 需要 的 时 间 。 因 此 可 以 写成 : 
runTime(n) ~ k(c)nlog.n fb | 
其 中 c 是 一 个 整数 变量 ， 而 k 是 一 个 函数 ， 它 的 值 依赖 于 ec。 证 明 runTime(cn) ~ 
runTime(n)(c+c/log.n) 
b. 使 用 习题 12.6a 中 的 方法 估算 当 runTime(100 000)=10 秒 时 ，runTime(200 000) 的 值 。 
12.7 证 明 插入 排序 中 需要 的 while 循 环 平均 迭代 次 数 是 
n(n—1)/4 


un 
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提示 首先 证 明 , SL n] 89k, A RR ES while sh H.-F 353 Ak BOE (e 0/2, 
(第 一 个 揪 入 的 项 对 应 着 k=1; 没有 “第 0” 项 。) 


12.8 证 明 O(logn!)=O(nlogn)。 
提示 n=JTi < [[n=n" 
( FER EH EP RIAL SHA.) 同样 ， 


A ni2 
n=[]i > [0/2 2 (0/2)? 
ix! i=] 
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Alek (n/2)"? <n! < n” 

然后 取 对 数 。 
12.9 证 明 用 七 次 比较 就 足以 排序 任何 五 个 项 的 序列 。 
提示 ”比较 第 一 个 和 第 二 个 项 ; 比较 第 三 个 和 第 四 个 项 ; 再 比较 前 两 次 比较 中 较 大 的 
项 。 通 过 三 次 比较 ， 得 到 三 个 项 的 有 序 链 ， 第 四 个 项 小 于 (或 等 于 ) 链 中 的 某 一 项 。 
现在 将 第 五 个 项 和 链 的 中 间 项 比较 。 再 用 三 次 比较 完成 排序 。 注 总 log;(50)>6， 因 此 
使 用 六 次 比较 是 不 足以 排序 任何 五 个 项 的 序列 的 。 


12.10 使 用 快速 排序 在 下 面 的 容器 中 完成 第 二 层 的 分 隔 ; 第 一 层 分 隔 后 有 : 


39 18 28 27 19 16 34 47 1001 56 92 45 61 72 


last first 
假设 网 值 为 1。 | 
12.11 给 出 一 个 支持 随机 访问 迭代 器 的 容器 (如 数组 、 向 量 或 双 端 队列 )， 通用 型 算法 
nth. element ft 4) Bá MJ xx f zx firstlllast-127 JB] JJ. EXPE BE DI e: 


/后 置 条 件 : 对 任何 满足 first<=itrt itr2<lasthyie+ itr Mitre, 
Il w Ritri<=position, ABA!(*position<*itr1), position 
// <=itr2, 354. (*itr2«*position), 


template<class RandomAccesslterator> 

void nth element (RandomAccesslterator first, 
RandomAccesslterator position, 
RandomAccesslterator last); 


例如 ， 假 设 v* 是 一 个 由 int 项 组 成 的 vector 容 器 。 可 以 按 如 下 方式 输出 v 中 所 有 项 的 中 值 : 


vector<int>::iterator mid itr = v.begin( ) + (v.end( ) — v.begin( )) / 2; 
nth. element (v.begin( ), mid itr, v.end( )): | 
cout << *mid itr << endl: 


惠普 的 实现 是 使 用 一 个 包装 函数 ， 它 开始 时 调用 一 个 辅助 算法 确定 项 *first 的 类 
型 。 下 面 是 nth_element 和 辅助 算法 的 定义 : 


template <class RandomAccessiterator> 

inline void nth element(RandomAccessiterator fi rst, 
RandomAccesslterator nth, 
RandomAccesslterator last) 

{ 

__nth_element(first, nth, last, value. type(first)); 


} 


template <class RandomAccesslterator, class T> 

void nth element(RandomAccesslterator first, 
RandomAccessiterator nth, 
RandomAccessiterator last, T*) 





AE 








it l 399 


while (last — first > 3) 
{ : 
RandomAccesslterator cut = — unguarded. partition 
(first, last, 
T(__median(“first, *(first + (last — first)/2), *(last — 1)))y; 
if (Cut <= nth) 
first — cut; 
else 


last — cut; 


} 
. insertion sort(first, last); 


} 
估算 averageTime(n) 和 worstTime(n)。 开 发 一 个 运行 时 间 测 试 来 验证 这 个 估算 。 


12.12 仕 所 有 排序 算法 中 ， 基 简单 的 是 选择 排序 。 假 设 容器 支持 随机 访问 迭代 器 一 一 也 可 


依次 类 推 。 


以 勉强 用 支持 双向 选 代 器 的 容器 。 为 了 排序 从 first 位 置 (包括 在 内 ) 到 last 位 置 (不 
包括 在 内 ) 的 项 ， 需 要 将 最 小 的 项 和 first 位 置 上 的 项 交换 ， 次 小 项 和 first+1 位 置 上 
的 项 交换 ， 依 次 类 推 。 下 面 是 方法 接口 : 


I RRR: 从 first (包括 在 内 ) 到 last (不 包括 在 内 ) 的 项 按 升序 排列 。 

Hf worstTime(n)z&O(n*n), 

template<class RandomAccessliterator> 

void selection sort (RandomAccesslterator first, RandomAccesslterator last); 


例 假设 容器 由 下 列 值 组 成 : 
59 46 32 80 46 55 87 43 70 81 


首先 ， 循 环 通过 first 到 last-1， 找 到 最 小 项 32 位 于 firsty2 的 位 置 。 交 换 32 和 59， 
容器 现在 是 : 


32 46 59 80 46 55 87 43 70 81 


其 次 ， 循 环 通过 first+1 到 last-1， 找 到 次 小 项 43 位 于 first+7 的 位 置 。 交 换 43 和 
*(first+1)。 容 器 现在 是 : | 


32 43 59 80 46 55 87 46 70 81 


在 下 一 个 循环 中 ， 将 first+2 位 置 上 的 项 ( 即 59 ) 和 first+4 位 置 上 的 项 ( 即 46 ) 
交换 。 容 器 现在 是 : 


32 43 46 80 59 55.87 46 70 81 


实现 选择 排序 法 ， 并 提供 worstTime(n) 和 averageTime(n) 的 估算 


12.13 一 种 著名 的 但 是 效率 非常 差 的 排序 算法 是 冒 泡 排 序 。 从 一 个 支持 随机 访问 迭代 器 的 





容器 开始 -一 也 可 以 勉强 使 用 支持 双向 迭代 器 的 容器 。 在 第 一 次 循环 迭代 中 ， 有 一 
个 媒 套 的 循环 将 每 个 项 和 高 一 个 位 置 上 的 项 比较 ,需要 时 进行 交换 。 第 二 次 (外 部 
循环 ) 迭代 返回 开始 处 ， 然 后 内 部 循环 比较 并 交换 项 。 继 续 这 个 过 程 直 到 容器 有 序 。 
为 了 避免 不 需要 的 比较 ， 内 部 循环 只 进行 到 外 部 循环 前 面 的 迭代 中 最 后 一 个 交换 为 
止 。 下面 是 方法 接口 : 
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HERRI: 从 first (包括 在 内 ) 到 last (不 包括 在 内 ) 的 项 按 升 序 排 列 。 

Hf worstTime(n)3x&O(n*n), 

template<class RandomAccesslterator- 

void bubble sort(RandomAccesslterator first, RandomAccesslterator last); 


B4 假设 容器 由 下 列 项 组 成 : 
59 46 32 80 46 55 87 43 70 81 
IRERE — XS TZ I: 
46 32 59 46 55 80 43 70 81 87 
这 时 惟一 能 保证 的 就 是 最 大 的 项 位 于 容器 中 最 后 的 索引 处 。 外 部 循环 的 第 二 次 
迭代 中 ， 不 断 进 行 比 饮 和 交换 ， 直 到 80 和 70 交 换 了 为 止 : 
32 46 46 55 59 43 70 80 81 87 
外 部 循环 的 第 三 次 迭代 中 仅 有 的 一 次 交换 是 交换 43 和 59， 并 且 当 发 现 59 小 于 70 
时 内 部 循环 停止 。 
32 46 46 55 43 59 70 80 81 87 
进行 3 次 以 上 的 外 部 选 代 后 ， 数组 排序 
32 43 46 46 55 59 70 80 81 87 | 
实现 冒 泡 排 序 。 顺 带 提 一 下 ， 内 部 循环 迭代 的 平均 数量 (正如 读者 所 猜想 的 ) 是 


“一 1)] ] ] 
ALIS 5 n "tD D ) a [m2 +tim($ -m )] 


+(2/3)J2a(n+1) +31/36+ O(n ^) PASTA 


ih gnKnuth(1973) sik, "fini. AWHA AH, BIT—-ARBiaw 
名 字 和 它 所 带 来 的 一 些 有 趣 的 理论 问题 ”。 


12.14 基数 排序 和 本 章 描述 的 其 他 排序 方法 有 着 “根本 的 ”不 同 。 这 个 排序 方法 基于 项 的 


内 部 表示 ， 而 不 是 基于 项 之 间 的 比较 。 因 此 ，worstTime(n) 不 会 好 于 O(nlogn) 的 限 
制 在 这 里 并 不 适用 。 而 且 实 际 上 ， 基 数 排序 是 worstTime(n) 为 O(nlogn) 的 算法 的 基 
iy ( W Andersson, 1995), 

基数 排序 广泛 应 用 于 电动 机 械 穿孔 卡片 排序 程序 中 。 感 兴趣 的 读者 可 以 参考 
Shaffer(1998), 

T CIR He — A MA firsti 98 Bl last-1:2 A Sc FEBR BLU IR RBMAB. UT 
简化 ， 首 先 把 每 个 项 都 设置 成 一 个 至 少 包含 两 个 十 进 制 位 的 非 负 整数 。 表 示 法 是 基 
于 10 的 ， 也 可 以 说 是 以 10 为 基数 的 ， 这 正 是 基数 排序 得 名 的 原因 。 除 了 即将 排序 的 
容器 之 外 ， 还 有 一 个 包含 10 个 list 容 器 的 lists 数 组 ， 即 十 个 可 能 的 数字 位 中 的 每 一 个 
分 别 对 应 一 个 链表 。 

在 第 一 次 外 部 循环 迭代 中 ， 容 器 中 的 每 一 项 被 添加 到 项 的 个 位 (最低 有 效 位 ) 
所 对 应 的 链表 中 。 然 后 ， 从 每 个 链表 的 头 开始 ，lists[0] 、lists{1] 等 等 中 的 项 被 存 回 
原 容 器 里 。 这 就 重 写 了 原 容器 。 在 第 二 次 外 部 循环 从 代 中 ， 容 器 中 的 每 一 项 被 添加 
到 项 的 十 位 所 对 应 的 链表 中 。 然 后 ， 从 每 个 链表 的 头 开 始 ，lists[0] 、lists[1] 等 等 中 
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的 项 被 存 回 原 容 器 里 。 下 面 是 方法 接口 : 


// 前 置 条 件 : 项 是 整数 。 

WERKE: 从 first (包括 在 内 ) 到 last (不 包括 在 内 】 之 间 的 项 按 升序 排列 。 
// worstTime(n) 见 下 面 的 注释 。 

template<class RandomAccesslterator> 

void radix_sort(RandomAccesslterator first, RandomAccesslterator last); 


Gil 假设 从 下 面 的 容器 开始 : 
85 3 19 43 20 55 42 21 91 85 73 29 
其 中 的 每 一 项 都 被 添加 到 它 的 最 右 位 所 对 应 的 链表 中 。( 从 概念 上 说 ， 更 简单 
的 办 法 是 把 每 个 链表 看 作 一 个 以 NULL 终 结 的 单 链 表 ， 而 不 是 带 有 头 的 双 链 表 . ) SE 
表 的 数组 如 下 : 


NULL 


然后 ， 从 每 个 链表 的 头 开始 ，lists[0]、lists[1] 等 等 中 的 项 被 存 回 原 容 器 里 : 
20 21 91 42 3 43 73 85 55 85 19 29 
在 下 一 个 外 部 循环 迄 代 中 ， 容 器 中 的 每 一 项 被 添加 到 它们 十 位 所 对 应 的 链表 中 : 


lists 


E 


Ra 〈 由 于 这 些 整 数 至 多 有 两 位 ) ， 从 每 个 链表 的 头 开始 ，lists[0]、lists[1] 等 等 
中 的 项 被 存 回 原 容器 里 ， 容 器 现在 是 有 序 的 : 


3 19 20 21 29 42 43 55 73 85 85 91 
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对 任意 的 非 负 int 项 组 成 的 容器 实现 基数 排序 。 假 设 N 是 容器 中 最 大 的 整数 。 外 
部 循环 迭代 的 数量 至 少 是 ceil(log,oN)， 因 此 worstTime(n,N) 是 O(nlogN)。 


注意 ”基数 排序 中 的 项 是 整数 ， 但 是 稍微 做 一 下 改动 ， 项 的 类 型 就 可 以 换 成 string 之 
类 的 类 型 。 在 此 情况 下 string 类 中 的 每 个 字符 都 应 当 对 应 一 个 链表 。 


编程 项 目 12.1: 排序 一 个 文件 


将 一 个 文件 按 升序 排序 

分 析 

输入 行将 包含 即将 被 排序 的 文件 路 径 。 文 件 中 的 每 一 项 将 由 姓名 (名 后 面 是 一 个 空格 ， 
随后 是 姓 ， 然 后 又 是 空格 ， 之 后 是 中 间 名 ) 以 及 社会 保障 号 码 组 成 。 根 据 姓名 排序 文件 ; 姓 
名 相同 的 根据 社会 保障 号 码 排序 。 例 如 ， 排 序 之 后 的 文件 部 分 可 能 如 下 : 

Jones Jennifer Mary 222222222 

Jones Jennifer Mary 644644644 


为 了 方便 起 见 ， 可 以 假设 每 个 名 字 都 有 一 个 中 间 名 。 假 设 文件 persons.dat 由 以 下 项 组 成 : 


Kiriyeva Marina Alice “333333333 
Johnson Kevin Michael ^ 555555555 
Misino John Michael ^ 444444444 
Panchenko Eric Sam — 888888888 
Taoubina Xenia Barbara 111111111 
Johnson Kevin Michael 222222222 
Deusenbery Amanda May 777777777 
Dunn Michael Holmes 999999999 
Reiley Timothy Patrick — 666666666 


系统 测试 1 


Please enter the path for the file to be sorted. 
The file persons. dat has been cote. Please close this output window when you are 
k ! | DEP PS Tianhe meta cde asian 


文件 Persons.dat 现 在 的 组 成 将 是 : 


Deusenbery Amanda May 777777777 
Dunn Michael Holmes 999999999 
Johnson Kevin Michael 222222222 
Johnson Kevin Michael ^ 555555555 
Kiriyeva Marina Alice 333333333 
Misino John Michael ^ 444444444 
Panchenko Eric Sam 888888888 
Reiley Timothy Patrick 666666666 
Taoubina Xenia Barbara. 111111111. 


使 用 相同 的 人 名 进行 随机 生成 的 大 型 的 系统 测试 。 企 会 你 麻 号 码 将 是 随机 产生 的 0~32 767 
的 int 项 。 例 如 ， 部 分 文件 可 能 包含 : 
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aaa 9736 
aaa 5917 
aaa 8476 


提示 如果 确信 整个 文件 能 够 族 入 内 存 ， 那 么 这 将 是 一 个 相当 简单 的 问题 。 但 是 并 非 
如 此 。 假 设想 排序 类 Person 中 的 对 象 组 成 的 一 个 大 文件 。 具 体 地 讲 ， 假设 Person 类 中 
的 一 个 对 象 占据 50 个 字 节 ， 并 且 数 组 的 最 大 存储 量 是 500 000 字 节 。 因 此 Person 数 组 
的 最 大 容量 是 10 000, 


先 将 人 的 文件 读 入 一 个 数组 (或 向 量 ) ， 每 个 块 由 10 000 个 人 组 成 。 每 个 块 用 堆 排 序 方法 
排序 并 以 交替 方式 存 人 两 个 临时 文件 之 一 : leftTop 和 1leftBottom。 图 12-4 说 明了 该 文件 排序 第 
一 阶段 的 结果 。 

然后 不 断 通过 交替 过 程 ， 直 到 所 有 项 都 有 序 并 存储 在 单个 文件 中 。 使 用 的 临时 文件 是 
leftTop, 、leftBottom 和 rightBottom; personsFile 自 身 扮 演 了 rightTop 的 角色 。 在 每 个 阶段 ， 
我 们 将 文件 项 部 和 底部 的 文件 对 中 的 两 个 块 归并 ， 结 果 是 两 倍 大 小 的 块 交替 地 存储 在 其 他 
的 顶部 和 底部 文件 对 中 。 把 两 个 文件 中 的 有 序 块 归 并 成 另 一 文件 中 的 有 序 、 双 倍 大 小 块 的 
代码 在 merge 方 法 中 就 基本 完成 了 一 一 使 用 列表 而 不 是 文件 块 。 图 12-5 说 明了 第 一 个 归并 
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图 12-4 文件 排序 的 第 一 阶段 : 将 personsFile 中 的 每 个 未 排序 块 插入 一 个 数组 ， 
通过 堆 排 序 方法 排序 并 存 入 leftTop 或 leftBottom 


personsFile 


1&2|5&6| 


rightBottom 
espas 


图 12-5 文件 排序 中 第 一 次 归并 的 过 程 。 文 件 leftTop 和 leftBottom 里 包含 了 有 序 块 ， 
而 personsFile 和 rightBottom 里 包含 了 双 倍 大 小 的 有 序 块 


如 采 在 一 次 自 左 至 右 归 并 之 后 rightBottom 仍 旧 是 空 ， 那 么 排序 结束 并 且 在 personsFile 里 保 
存 了 排序 的 文件 。 否 则 就 执行 自 右 至 左 的 归并 ,之 后 将 检查 leftBottom 是 否 仍旧 为 空 。 如 果 是 ， 
那么 将 leftTop 拷 贝 到 personsFile 中 ， 排 序 结束 。 

这 将 花费 多 长 时 间 呢 ?假设 在 n/k 块 中 有 n 项 ， 每 个 块 的 大 小 是 k。 在 堆 排 序 阶段 ， 创 建 n/k 
块 中 的 每 个 有 序 块 平均 需要 大 约 klog,k 的 时 间 。 每 个 归并 阶段 只 进行 4 次 迭代 ， 并 且 有 大 约 
log,(n/) 个 归并 阶段 。 总 时 间 就 是 所 有 阶段 的 时 间 之 和 ， 粗 略 计算 是 ， 
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(n/k)klog,k + nlog;(n/k) = nlog,k + nlog,(n/k) 
= nlog,k + nlog.n — nlog.& 


= nlog,n 


因为 averageTime(n) 是 最 优 的 ， 即 O(nlogn)， 所 以 这 样 的 排序 算法 经 常 被 用 于 系统 排序 实 
用 程序 中 。 











第 13 章 ”查找 和 散 列 类 


在 第 12 章 里 设计 了 几 个 排序 算法 。 现 在 介绍 一 个 同等 重要 的 查找 。 先 总 结 几 个 简单 的 查 
找 算法 揭 开 介绍 新 类 一 一 hash_map 一 一 的 序幕 。 这 个 类 尚未 包括 企 标 准 模板 库 中 。 但 是 散 列 映 
射 在 某 些 应 用 中 是 非常 有 用 的 ， 比 如 创建 一 个 符号 表 。 基 本 上 ， 它 的 insert、find 和 erase 方 法 
的 平均 时 间 花 费 都 是 常数 ! 这 个 显著 的 性 能 应 归功 于 一 个 特殊 的 称 作 散 列 的 技术 。 


目标 


D 理解 散 列 工作 的 原理 ， 了 解 什么 时 候 应 当 使 用 它 ， 而 什么 时 候 不 应 当 使 用 它 。 
2) 解释 均匀 散 列 设想 的 意义 。 
3) 比较 不 同 的 冲突 处 理 程序 : 链 式 ，1- 偏 移 ， 商 - 偏 移 。 


13.1 分 析 查 找 的 框架 


在 开始 考虑 查找 方法 之 前 ， 我 们 需要 一 个 框架 来 分 析 它 们 。 因 为 查找 可 能 成 功 ， 也 可 能 失 
败 、 所 以 查找 算法 的 分 析 应 当 包 含 这 两 种 可 能 性 。 为 每 个 查找 方法 估算 averageTimes(n)， 即 成 
功 碍 找 集合 中 全 部 "个 项 的 平均 时 间 。 可 以 简单 地 假设 容器 中 的 每 一 项 被 查找 的 几率 是 相同 的 。 

我 们 对 worstTimes(n) 也 比较 感 兴趣 ， 就 是 成 功 查 找 一 项 所 需要 的 语句 最 大 数量 。 也 就 是 
说 ， 给 定 一 个 n 值 ， 需 要 考察 "个 项 的 全 体 置 换 以 及 成 功 搜寻 项 的 所 有 可 能 的 选择 。 对 每 个 置 
换 和 项 ， 确 定 查 找 该 项 所 需要 的 迭代 (或 递归 调用 ) 次 数 。 那 么 与 最 大 欠 代 次 数 相 对 应 的 就 
Xe worstTime,(n) . 

也 可 以 估算 averageTimew(n)， 即 失败 查找 的 平均 时 间 以 及 worstTimey(n)。 对 失败 的 查找 ， 
假设 在 平均 情况 下 ， 每 个 可 能 的 失败 都 是 等 几率 的 。 例 如 ， 在 n 项 的 有 序 容器 里 ， 一 个 失败 查 
找 根 据 给 定 项 的 位 置 共 有 n+1 种 可 能 性 : 

在 容器 中 第 一 项 之 前 

在 第 一 项 和 第 二 项 之 间 

在 第 二 项 和 第 三 项 之 间 

在 第 (2-1) 项 和 第 “项 之 间 

在 第 n 项 之 后 

13.2 布 复习 了 至 今 使 用 过 的 查找 方法 。 


13.2 查找 方式 复习 


迄今 为 止 已 经 了 解 到 三 种 不 同 的 查找 方式 : 顺序 查找 ， 折 半 查 找 和 面向 树 的 查找 。 下 而 
将 依次 看 一 下 这 些 查 找 方式 。 | 


13.2.1 顺序 查找 
通用 型 算法 find 有 如 下 的 接口 : 
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// 后 置 条 件 : 如 果 从 first {包括 在 内 ) 到 last (不 包括 在 内 ) 之 间 的 迭代 器 中 
// 有 一 项 等 于 value ， 那 么 返回 的 迭代 器 就 是 满足 "i=value 的 范围 内 的 第 一 个 
// a, qdsbR[[last, worstTime(n)z&O(n), 
template<class Inputlterator, class T» 
514 Input!terator find(Inputiterator first, Inputlterator last, const T& value); 


下 面 是 惠普 的 实现 : 


template <class inputiterator, class T> 
Inputlterator find(Inputlterator first, Inputlterator last, const T& value) 


{ 
while (first != last && “first != value) 
+ +first; 
return first; 


} 


find 算 法 表现 了 在 first (包括 在 内 ) 到 1last (不 包括 在 内 ) 的 迭代 器 中 的 顺序 查找 。 项 
“first、“++first 等 等 分 别 和 搜寻 值 进行 比较 ， 直 到 找到 这 个 值 或 在 规定 区 域内 没有 迭代 器 位 于 
这 个 值 上 。 由 于 项 是 被 线性 访问 的 ， 所 以 find 可 以 和 任意 支持 前 向 迭代 器 的 容器 类 一 起 使 用 ， 
也 就 是 可 以 和 迄今 为 止 我 们 了 解 的 所 有 除 容 器 配 接 器 之 外 的 容器 类 一 起 使 用 。 

顺序 查找 不 论 成 功 与 否 ， 平 均 和 最 坏 时 间 花 费 都 和 7 成 线性 关系 。 

在 一 个 容 磺 中 查找 时 ， 假 设 每 项 被 搜寻 到 的 几率 是 相等 的 。 因 此 循环 迭代 (或 递归 调用 ) 
的 平均 数量 近似 为 |/2。 因 此 averageTimes(n) 和 n 成 线性 关系 。 最 坏 情 况 下 ， 容 器 中 的 最 后 一 项 
就 是 要 搜寻 的 项 ， 因 此 进行 了 n 次 迭代 ，worstTimes(n) 仍 和 nn 成 线性 关系 。 

在 失败 查找 中 ， 断 定 给 定 项 不 在 容器 里 之 前 ，find 必 须 访问 全 部 的 x 项 ， 因 此 average,(n) 
和 worstTimevz) 都 和 z 成 线性 关系 。 | | 


13.2.2 WEER 


有 时 我 们 会 预先 知道 容器 是 有 序 的 。 可 以 调用 通用 型 算法 binary_scarch 来 排序 项 ， 算 法 得 
名 是 因为 搜索 段 的 大 小 是 不 停 被 分 成 两 半 的 。 重 复 实验 10 的 内 容 ， 这 里 给 出 该 算法 的 惠普 的 
实现 (项 根据 operator< 排 序 ) : | 


template <class Forwardlterator, class T> 

inline bool binary search (Forwardlterator first, 
Forwardlterator last, 
const T& value) 


Forwarditerator i — lower boundffirst, last, value); 
return i != last && !(value < *i); 
} 


回想 通用 型 算法 lower_bound 将 返回 位 于 容器 中 能 够 存储 item 且 不 会 破坏 序列 顺序 的 第 一 
个 位 置 的 迭代 器 。lower_bound 算 法 调用 了 两 个 都 名 为 、lower_bound 的 辅助 算法 之 一 ， 但 是 这 
两 个 算法 的 参数 根据 选 代 器 是 随机 访问 迭代 器 还 是 前 向 选 代 器 而 不 同 。 下 面 是 使 用 随机 访问 
[15] EREHE: 
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template «class RandomAccesslterator, class T, class Distance 
RandomAccessiterator lower bound (RandomAccesslterator first, 
RandomAccessiterator last, 
const T& value, 
Distance", 
random access, iterator tag) 


Distance len = last — first; 
Distance half; 
. RandomAccesslterator middle; 


while (len > 0) 
{ 
haif = len / 2; 
middle = first + half; 
if (“middie < value) 
{ 
first = middle + 1: 
len = len — half — 1; 


) 


else 
len = half; 


} 


return first: 


} 


在 分 析 binary_search 算 法 之 前 ， 注 意 它 返 回 一 个 bool 值 ， 而 不 是 迭代 器 ， 因此 如 果 只 希 
望 了 解 项 是 否 在 序列 中 ， 那 么 应 当 使 用 binary_search。 如 果 想 了 解 项 在 哪里 或 者 可 以 插入 它 
的 位 置 ， 那 么 应 当 直接 调用 lower_bound。 

对 折 半 查找 而 言 ， 无 论 成 功 与 否 ， 平均 和 最 坏 时 间 花 费 部 和 n 成 对 数 关系 。 

对 一 个 支持 随机 访问 迭代 器 的 容器 (如 数组 、 向 量 或 双 端 队列 ) ME, binary_search 比 通 
用 型 算法 find 快 很 多 。 无论 查找 是 否 成 功 ，_lower_bound 中 的 while 循 环 将 继续 下 去 下 到 len=0， 
令 n 表 示 first 和 last 之 间 的 距离 。 因 为 len 开 始 时 使 用 的 值 ， 所 以 循环 迭代 的 次 数 将 是 4 可 以 除 以 
2 直到 n=0 的 次 数 ， 并 且 该 次 数 近似 为 1og:m。 因此 得 到 averageTime,(n)=worstTime,(n)= 
averageTimeu(n)=worstTimeu(n)， 它 们 都 和 nn 成 对 数 关系 。 

同 忆 在 实验 10 中 ， 为 什么 找到 一 个 匹配 时 没有 中 止 _lower_bound 中 的 while 循 环 ， 这 是 
出 于 效率 的 考 虚 。 在 测试 匹配 时 加 入 一 个 额外 的 比较 将 耗费 更 长 的 时 间 ， 除 非 查 找 成 功 并 日 
在 较 早 的 迭代 中 就 找到 了 搜索 项 。 

仅 使 用 前 向 迭代 器 的 _lower_bound 算 法 版 本 与 使 用 随机 访问 迭代 器 的 版 本 基本 一 致 ， 除 
[fr | 
middle = first + half; 

被 替换 为 

middle = first; 

advance(middle, half); 
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iterator. 中 的 advance 算 法 里 包 合 了 一 个 执行 halt 次 的 循环 ， 每 次 循环 迭代 中 都 将 增加 
middle〈 增 量 为 1)。 这 个 一 lower_bound 版 本 不 论 在 成 功 还 是 失败 时 ， 平均 和 最 坏 情 况 下 都 将 
花费 线性 时间 。 


13.2.3 红 黑 树 查 找 


在 第 10 章 中 介绍 过 红 黑 树 。rb_tree 类 中 的 find 方 法 (与 find 通 用 型 算法 相反 ) 和 
_lower_bound 通 用 型 算法 相当 相似 。 下 面 是 find 方 法 : 


iterator find(const Key& k) 
{ 
link, type y = header; /最 后 一 个 不 小 于 k 的 节点 。%/ 
link_type x = root( ); 让 当前 节点 */ 
while (x != NIL) 
if (Ikey_compare(key(x), k)) 
y = X, X = left(x); // 逗号 运算 符 是 合法 的 


else 
x = right(x); 
iterator j = iterator(y); 
return (j == end() || key_compare(k, key(j.node))) ? end( ) : j; 


} 


对 红 黑 树 查找 而 言 ， 无 论 成 功 还 是 失败 ， 平 均 和 最 坏 情 况 下 的 时 间 都 和 1 成 对 数 关系 。 

正如 lower_bound 通 用 型 算法 中 一 样 ， 不 要 专门 去 测试 匹配 更 有 效率 。 红 黑 树 的 高 度 和 
?成 对 数 关 系 ， 并 且 find 方 法 总 是 从 根 和 迭代 到 一 个 树叶。 而 从 根 到 任何 一 个 树叶 的 距离 至 少 是 
height(1)/2。 因 此 对 rb_tree 类 中 的 find 方 法 而 言 ， average Time,(n)=worstTime,(n)=average- 
Timeu(n)=worstTimey(n)， 它 们 都 和 成 对 数 关 系 。 

本 章 的 其 余部 分 将 致力 于 hash_map 类 的 研究 。 除 了 前 置 条 件 中 的 时 间 估 算 ，hash_map 类 
的 方法 接口 和 第 10 章 中 的 map 类 没什么 实质 的 分 别 。 


13.3 hash_map 类 


本 闻 将 概述 hash_map 类 的 用 户 接口 ， 该 类 并 不 是 标准 模板 库 的 一 部 分 。 回 忆 前 面 ， 键 是 
项 的 一 部 分 ， 而 且 它 是 访问 项 的 依据 。hash_map 类 是 模板 化 的 ， 而 且 和 map 类 一 样 ， 它 的 两 
个 模板 参数 是 Key 和 T。 每 个 值 都 是 一 个 对 ， 它 的 第 一 个 组 成 部 分 是 Key 类 型 ， 第 二 个 组 成 部 
分 是 T 类 型 的 。hash_map 容 器 中 任意 两 个 值 都 不 能 使 用 相同 的 键 ， 并 且 键 是 根据 相等 运算 符 
operator== 进 行 比 较 的 。 

这 里 不 再 提供 现成 的 hash_map 类 ， 而 是 开发 一 个 准 系统 (只 能 通过 关联 数组 运算 符 ， 运 
算 符 [] 进 行 扩 张 )、 这 允许 我 们 可 以 进行 更 多 有 关 基 本 性 质 的 讨论 。 从 用 户 的 角度 来 说 ， 
hash_map 和 map 除 了 时 间 估 算 ， 并 设 有 什么 不 同 。 基 本 上 ，hash_map 中 的 查找 ， 插 信和 删除 
的 averageTime(n) 都 是 常数 1 

下 面 是 方法 接口 : 

1. /后 置 条 件 : 这 个 hash_map 是 空 

hash_map(); 








N 


. // 后 置 条 件 : 返回 这 个 hash_map 中 项 的 数量 . 
int size(); 


3. /后 置 条 件 : 如 果 一 个 包含 x 的 键 的 项 已 经 被 插入 到 这 个 hash_map 中 ， 那 么 返回 的 对 就 由 位 于 
i 早先 被 插入 项 的 迭代 器 和 false 组 成 。 否 则 ， 返 回 的 对 就 由 位 于 新 插入 项 
1 的 迭代 器 和 true 组 成 。 时 间 估 算 将 在 第 13.3.6 节 中 探讨 。 


pair<iterator,bool> insert(const value_type<const key_type, T>& x); 


4. // 后 置 条 件 : 如 果 这 个 hash_map 里 已 经 包含 了 键 部 分 是 key 的 值 ， 那 么 就 返回 对 该 值 第 二 个 
i 组 成 部 分 的 引用 。 人 否则 ， 就 将 一 个 新 的 值 <key T()> 插 入 这 个 映射 。 时 间 
// 估算 将 在 13.3.6 节 中 探讨 。 
T& operator[](const key type& key); 


9. /后 置 条 件 : 如 果 这 个 hash_map 里 已 经 包含 了 键 组 件 是 key 的 值 ， 就 返回 位 于 该 
Hi 值 的 迭代 器 。 否 则 ， 将 返回 和 end() 返 回 值 相向 的 迭代 器 。 时 间 估 算 将 在 13.3.6 
H 节 中 探讨 。 


iterator find(const key_type& key); 


. // 前 置 条 件 : itr 位 于 这 个 hash_map 中 的 某 个 值 上 。 

HR XE STE: 从 这 个 hash_map 里 删除 itr 位 置 上 的 值 。 时 间 估 算 将 在 13.3.6 节 

I 中 探讨 。 

void erase(iterator itr); 

BRE: 返回 位 于 这 个 hash_map 开 头 的 迭代 器 。 时 间 估 算 将 在 13.3.6 节 中 

iI 探讨 。 

iterator begin(); 

HAER 返回 一 个 迭代 器 ， 它 可 以 用 在 比较 中 用 来 判断 迭代 通过 这 个 hash_map 的 
// 过 程 是 否 应 当 结 束 。 

iterator end(); 


. /后 置 条 件 : 这 个 hash_map 对 象 的 空间 被 回收 
~hash_map(); 

为 了 简单 起 见 ， 关 联 迭 代 器 选择 的 是 前 向 迭代 器 。 仅 有 的 运算 符 是 〈 后 加 ) operator++ 
(int)、operato 六 、operator== 和 operator!=。 这 些 是 友 代 通过 一 个 容器 所 需要 的 全 部 运 
算 符 。 


13.3.1 hash_map 类 中 的 字段 


企 确定 hash_map 类 的 字段 的 过 程 中 ， 首 先 回忆 一 下 前 一 章 中 的 链 式 或 连续 表示 法 。 但 是 
如 朱 项 是 无 序 的， 那么 就 需要 顺序 查找 ， 这 在 平均 情况 下 将 花费 线性 时 间 。 即 使 项 是 有 序 的 ， 
并 且 可 以 使 用 这 个 顺序 ， 最 理想 的 查找 也 只 能 获得 对 数 平均 时 间 花 费 。 

本 章 的 剩余 部 分 将 致力 于 说 明 如 何 通 过 散 列 获得 查找 、 插 入 和 删除 的 常数 平均 时 间 花 费 . 
一 旦 定义 了 散 列 是 什么 以 及 它 是 如 何 工作 的 ，hash_map 方 法 的 定义 就 变 得 相对 简单 了 ， 
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一 开始 ， 让 我 们 先 考察 使 用 下 面 两 个 字段 的 连续 实现 : 
buckets: 一 个 值 数 组 
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count: hash_map 容 器 中 值 的 数量 
首先 介绍 一 个 极 简 单 的 例子 ， 然 后 再 继续 介绍 一 些 更 现实 的 例子 。 假 设 数 组 初始 化 为 保 
存 1000 个 项 一 个 三 位 的 键 组 件 一 一 它 保 存 了 标识 符 (ID) 号 码 和 - :个 
519) 用 来 保存 姓名 的 字符 串 组 件 。 当 调用 这 个 hash_map 类 的 构造 器 时 得 到 的 状态 如 图 13-1 所 示 。 





buckets count 





图 13-1 一 个 空 hash_map 容 器 的 表示 法 设计 


应 当 在 哪个 索引 处 存储 键 组 件 是 251 的 项 ? 一 个 显而易见 的 选择 是 索引 251。 它 有 几 个 
优点: 

1) 值 可 以 直接 插入 数组 中 ， 而 不 需要 访问 任何 其 他 的 值 。 

2) 以 后 对 该 值 的 查找 只 需要 访问 位 置 251. 

3) 能 够 直接 删除 该 值 而 不 需要 先 访 问 其 他 值 。 

图 13-2 显 示 了 插入 三 个 键 为 251、118 和 335 的 值 之 后 hash_map 容 器 的 可 能 状态 ， 刺 现在 省 略 
了 字符 串 组 件 ， 因 为 它们 和 这 个 讨论 是 无 关 的 。 

迄今 为 止 还 没有 做 什么 大 的 处 理 。 现 在 做 一 个 稍微 不 同 的 应 用 ， 假 设 数组 buckets 仍 旧 保 
人 存 了 1000 个 项 ， 但 是 每 个 项 使 用 了 社会 保障 号 码 作为 键 。 需 要 把 这 个 键 转换 成 数组 中 的 下 标 ， 
并 且 希 望 这 个 转化 能 够 快速 地 完成 ， 也 就 是 说 使 用 少量 的 循环 迭代 ，。 

为 了 能 进行 快速 的 访问 ， 选 取 社会 保障 号 码 最 右边 的 三 位 并 将 项 存储 在 索引 是 该 三 位 的 
位 置 上 。 例 如 ， 键 为 214-30-3261 ( 连 字号 只 是 为 了 增强 可 读 性 ) 的 项 将 被 存储 在 索引 261 E. 
同 理 ， 键 值 是 033-51-8000 的 项 将 被 存储 在 单元 0 上 。 图 13- -3 显示 了 这 两 次 插 和 人 操作 之 后 的 
hash_map 容 妖 。 

当 两 个 不 同 的 键 生成 相同 的 索引 时 就 发 生 冲 突 。 

读者 可 能 已 经 注意 到 这 个 方案 的 潜在 缺陷 : 两 个 不 同 的 键 可 能 有 相同 的 最 右边 的 二 :位 ， 
例如 ，214-30-3261 和 814-02-9261。 当 两 个 不 同 的 键 产生 相同 的 表 索 引 时 ， 就 称 作 冲 突 ， 并 
且 冲 突 的 键 称 作 同义词 。 不 久 将 处 理 冲突 问题 。 现 在 先 简单 地 认识 一 下 : 当 键 空间 的 大 小 
(也 就 是 合法 键 值 的 数量 ) 大 于 索引 空间 ( 即 可 用 单元 的 数量 ) 时 ， 冲突 的 可 能 性 就 总 是 存 
在 的 。 

散 列 是 将 一 个 键 转换 成 一 个 表 索 引 的 过 程 。 

散 列 是 将 一 个 键 转换 成 一 个 表 索 引 的 过 程 。 转 换 从 一 个 散 列 函 数 开始 : 在 键 上 执行 一 些 
容易 计算 的 操作 并 返回 一 个 unsigned long (无 符号 长 整 型 ) 值 ， 然 后 将 它 转化 成 数组 
buckets 里 的 一 个 索引 。 散 列 中 的 其 他 部 分 是 冲突 处 理 程序 。 
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图 13-2 在 图 13-1 中 插入 三 个 项 之 后 的 hash_map 容 器 。 只 显示 了 键 字段 
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0 





图 13-3 包含 两 个 项 的 hash_map 容 器 。 键 是 社会 保障 号 码 。 人 允许 用 字符 串 表 示 -- 个 姓名 
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冲突 处 理 是 散 列 算法 的 一 个 重要 部 分 。 

术语 散 列 暗示 着 按 某 种 方式 扰乱 键 ; 换 句 话说 ， 用 键 进 行 散 列 。 不 论 是 否 成 功 地 届 询 这 
些 键 ， 都 有 可 能 发 生 冲 突 ， 因 此 必须 将 冲突 处 理 作为 散 列 算 法 的 一 部 分 。 下 面 将 研究 一 个 简 
单 有 效 且 十 分 高 效 的 冲突 处 理 程序 : SEX. 


13.3.3 E 


当 使 用 链 式 处 理 冲突 时 ， 每 个 表单 元 都 包含 了 键 被 散 列 到 该 单元 的 索引 上 的 全 部 项 的 链表 。 
一 种 解决 冲突 的 方法 是 在 每 个 桶 条 目 上 存储 一 个 链表 ， 它 包含 了 所 有 和 键 被 散 列 到 该 
buckets 数 组 中 该 索引 上 的 项 。 


template<class Key, class T, class HashFunc> 
class hash_map 


{ 
typedef Key key type; 
typedef HashFunc hash, func; 


第 三 个 模板 参数 对 应 的 模板 变 元 是 一 个 函数 类 ， 即 函数 调用 运算 符 一 一 operator() 一 一 被 
重 载 的 类 。 这 个 被 重 载 的 运算 符 的 头 是 : 
unsigned long operator()(const key_type& key) 


例如 ， 如 来 每 个 键 都 是 一 个 int， 那 么 可 以 定义 如 下 的 简单 的 函数 类 : 


class hash_func 


{ 
public: 
unsigned long operator( ) (const int& key) 


{ 
return (unsigned long)key; 


) / 重 载 运算 符 () 
)// 类 hash func 


在 继续 深入 之 前 ， 先 看 一 个 简单 的 程序 ， 它 用 了 一 个 hash_map 容 器 来 存储 一 些 学 生 的 六 
位 ID 号 码 和 名 。 


#include <iostream> 
#include <string> 
#include "hash map1.h" 


class hash func 
{ 
public: 
unsigned long operator( ) (const int& key) 


{ 
return (unsigned long)key; 


}/ 运算 符 () 
};// 类 hash func 


int main( ) { 
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typedef hash, map «int, string, hash func» hash map. class; 


const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


hash map. class students; 
hash map. class::iterator itr; 


value type- const int, string> student(555555, "Mike"); 
students.insert (student); 


students .insert (value type« const int, string (333333, "Alan")); 
students [111111] = "Bob"; 


cout << "size = "<< students.size( ) << endl: 
for (itr = students.begin( ); itr != students.end( ); itr+ +) 
cout << ('itr).first << "" << ("itr.second << endl; 
cout << "looking for " << 333333 << endl: 
itr = students.find (333333); 
if (itr == students.end( )) 
cout << "not found " << endl: 
else 
cout << "found " << (“itr).first << endi; 


cout << "looking for " << 222222 << endl; 
itr = students.find (222222); 
if (itr == students.end( )) 
cout << "not found " << endl; 
else 
cout << "found " << ('itr).first << endl; 


for (int i = 0; i < 500; i+ +) // ids: 000000, 000001, 000002, . . . 
students [i] = ""; 


cout << “size = " << students.size( ) << endi; 


cout << "removing 111111" << endi; 
students.erase (students.find (111111)); 


cout << "size = " << students.size( ) << endi; 
if (students.find (111111) == students.end( )) 
cout << "111111 not in map" << endl; 
else 
cout << "oops, 111111 found in map" << endl: 


if (students.find (444444) == students.end( )) 

cout << "444444 not in map" << endl; 
else 

cout << "oops, 444444 found in map" << endl: 
cout << endl << CLOSE WINDOW PROMPT, 
cin.get( ); 


return 0: 
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这 个 程序 的 输出 是 : 


Size = 3 

555555 Mike 
111111 Bob 
333333 Alan 
looking for 333333 
found 333333 Alan 
looking for 222222 
not found 

size = 503 
removing 111111 
size — 502 

111111 not in map 
444444 not in map 
Please press the Enter key to close this output window. 


现在 继续 hash_map 类 的 设计 。 在 buckets 数 组 的 每 个 索引 上 将 存储 一 个 列表 ， 它 当中 是 所 
有 键 被 散 列 到 该 索引 上 的 项 。 这 个 设计 ( 即 链 式 散 列 ) 的 字段 是 : 


list<value_type<const key_type, T>>* buckets: // 在 buckets 数 组 的 每 个 索引 上 
/ 将 存储 所 有 其 键 被 散 列 到 该 
// 索引 上 的 项 组 成 的 列表 。 
int count, // 这 个 hash_map 中 项 的 数量 
length; // 这 个 hash_map 中 桶 的 数量 
hash. func hash; Ahash 是 一 个 函数 对 象 
每 个 表 中 的 项 构成 了 一 个 链 ， 这 也 正 是 术语 链 式 的 由 来 。 每 个 list 对 象 被 看 作 一 个 桶 ， 而 
且 每 个 项 都 被 存储 在 一 个 list 类 的 节点 中 。 回 忆 在 第 6 章 中 ， 每 个 节点 都 有 data (也 就 是 项 )、 
prev 和 next 字 段 。prev 字 段 在 hash_map 类 里 是 没有 用 的 ， 因此 假设 每 个 节点 将 由 一 个 item 字 段 
和 一 个 next 字 段 组 成 。 
为 了 解释 链 式 散 列 是 如 何 操作 的 , 考虑 使 用 社会 保障 号 码 作为 键 来 存储 1000 个 项 。 每 个 
项 一 一 即 值 一 由 键 和 姓名 组 成 。 因 为 每 个 键 都 是 int 型 的 ， 消息 hash(key) 只 不 过 是 返回 键 自 
身 ， 因 此 索引 是 key%1000。 最 初 ， 每 个 单元 中 将 包含 一 个 空 列表 。 图 13-4 显 示 了 应 用 下 列 
1&7 | | 
buckets[hash(key)%1 000].push_back(value); 


插入 有 如 下 键 的 值 之 后 的 状况 : 
214-30-3261 
033-51-8000 
214-19-9528 
819-02-9528 
819-02-9261 
033-30-8262 
215-09-1766 
214-17-0261 
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为 了 避免 图 13-4 散 乱 ， 每 个 桶 的 内 容 都 被 简化 了 。 严 格 地 说 ， 每 个 桶 包含 一 个 list 对 象 ， 
因此 每 个 桶 包含 list 类 中 的 字段 ， 如 _node、_last 和 __next_avail。 在 图 13-4 的 每 个 桶 中 显示 的 
只 有 其 中 的 _node->next， 它 指 问 列表 中 的 第 一 个 布点 。 并 且 假 设 每 个 列表 是 以 NULL 终 结 的 。 


buckets count 
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图 13-4 这 八 个 项 所 发 送 到 的 链 式 hash_map 容 器 ， 每 个 项 
是 一 个 < 键 ， 姓 名 > 对 。 在 本 图 中 省 略 了 姓名 字段 


为 了 更 好 地 洞察 一 些 实现 的 问题 ， 考 虑 当 key_type 不 是 整数 类 型 时 的 情况 。 例如 ， 假 设 每 
个 键 是 一 个 至 多 20 个 字符 的 string 对 象 。 下 面 是 在 hash_func 类 上 的 第 一 次 尝试 : 


(BS: 这 个 函数 类 只 是 为 了 起 说 明 作 用 。 不 要 使 用 它 ! | 
class hash_func 


{ 
public: 


unsigned long operator( ) (const string& key) - 
{ 
unsigned long total = 0; 
for (unsigned i = 0; i < key.length( ); i++) 
total += key [i]; 
return total; 
) / 运算 符 () 
}; // 类 hash_func 


这 个 类 满足 了 将 string 键 转换 成 unsigned long 类 型 的 最 小 需要 ， 但 是 它 有 几 个 缺点 。 首 
移 ， 包 含 相同 字母 但 是 顺序 不 同 的 字符 串 将 生成 相同 的 数字 。 例 如 , “sewn” 和 “news” 返 回 
的 数值 都 是 445 (因为 int(n)=110，int(e)=101，intCw)=119，intos)=115)， 

一 个 更 严重 的 问题 在 于 这 个 类 可 能 严重 地 限制 了 可 用 桶 的 数量 。 例 如 ， 假 设 每 个 键 仅 出 
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小 写字 母 组 成 。 那 么 产生 的 最 大 总 和 小 于 2500 (20 个 z) ， 而 很 多 较 小 的 数 将 不 会 产生 〈 例 如 ， 
123 到 193 )。 如 果 操 作 很 多 字符 串 ， 将 有 很 多 冲突 、 并 有 日 表 的 查找 是 顺序 的 。 

一 般 而 言 ， 我 们 希望 每 个 键 产 生 一 个 不 同 的 数字 。 这 对 至 多 20 个 小 写字 母 的 字符 串 是 不 
可 能 的 ， 因 为 大 约 有 26*' 个 这 样 的 字符 串 。 这 个 数 远 远大 于 unsigned long 类 型 中 最 大 的 数值 
(如 果 long 类 型 的 存储 占用 4 个 字 节 ， 就 是 2*)。 希 望 满 足 的 条 件 是 : 如 果 L 是 unsigned long 
的 数量 ， 那 么 两 个 键 产生 相同 unsigned long 值 的 几率 是 1L。 

下 面 的 程序 里 有 一 个 hash_func 类 ， 它 也 对 字符 串 中 的 字符 进行 了 合计 ， 但 是 每 部 分 的 总 
和 都 乘 以 了 13。 最 后 的 总 和 再 乘 上 一 个 很 大 的 素数 ， 确 保 当 key.length(O 很 小 时 也 能 产生 一 个 
大 的 数字 : 


#include <iostream> 
#include <string> 
#include "hash_map1.h" 


class hash_func 
526 { 
public: 


unsigned long operator( ) (const string& key) 
{ 
const unsigned long BIG_PRIME = 4294967291; 
unsigned long total = 0; 
for (unsigned i = 0; i < key.length( ); i++) 
totai = total * 13 + key [i]; 
return total * BIG PRIME; 


s) // 运算 符 () 
}; // 类 hash_func 


下 面 的 main 函 数 创建 了 一 个 由 学 生 的 姓名 和 年 级 平均 成 绩 组 成 的 hash_map 容 器 。 每 个 学 
生 的 姓名 被 散 列 到 hash_map 容 器 里 的 一 个 索引 上 。 
int main( ) { 
typedef hash map «string, float, hash func hash map class; 


const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window. "; 


hash, map. class students; 
hash. map. class: iterator itr; 


value type« const string, float> student("Mike", 3.2); 
value type«hash map class:iterator, bool>p = students.insert (student); 


students.insert (value type« const string, float> ("Alan", 3.6)); 
students ['Bob"] = 3.15; 
for (itr = students.begin( ); itr != students.end( ); itr+ +) 

cout << (‘itr).first << " " << (*itr).second << endl: 


(*(p.first)).second = 1.7; 








students ["Bob"] = 3.04; 

cout << "size = "<< students.size( ) << endl; 

for (itr = students.begin( ); itr != students.end( ); itr+ +) 
cout << (‘itr).first << " " << ('itr.second << endl; 


cout << "looking for" << "Alan" << endl; 
itr = students.find ("Alan"); 
if (itr == students.end( )) 
cout << "not found " << endl: 
else 
cout << "found " << (*itr).first << endl; 


cout << "looking for "<< "Jack" << endl; 
itr = students.find ("Jack"); 


if (itr == students.end( )) 
cout << "not found " << endl: 
else 
cout << "found " << Citr).first << endl; 


for (int i = 0; i < 500; i++) 
{ 

string temp = ""; 

students [temp + char (i)] = 2.0; 
) // for ® 


cout << "size = " << students.size( ) << endi; 


cout << "removing Bob" << endi; 
students.erase (students.find ("Bob")): 


cout << "size = " << students.size( ) << endl; 
if (students.find ("Bob") == students.end( )) 
cout << "no Bob" << endl: 
else 
cout << "oops" << endl; 
if (students.find ("Mike") == students.end( )) 
cout << "no Mike--oops" << endl; 
else 
cout << "Mike found" << endl: 


cout << endl << CLOSE WINDOW PROMPT. 
cin.get( ); 


return 0; 
) // main 


输出 是 : 


Bob 3.1 

Mike 3.2 
Alan 3.6 
size = 3 
Bob 3.04 
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Mike 1.7 

Alan 3.6 
looking for Alan 
found Alan 
looking for Jack 
not found 

size = 259 
removing Bob 
size = 258 

no Bob 

Mike found 


Please press the Enter key to close this output window. 


能 够 指出 为 什么 输出 的 从 next 到 1ast 的 大 小 只 是 259 的 道理 吗 ? 提示: 总 共 只 有 256 个 不 同 
SC 

均 习 散 列 设想 指 的 是 散 列 键 的 索引 是 独立 于 其 他 散 列 键 的 索引 的 。 

极为 重要 的 一 点 是 ，hash_func 类 要 成 功 地 进行 散 列 ， 产 生 int， 使 得 到 的 索引 分 布 在 整个 
表 中 。 这 个 观点 称 作 均匀 散 列 设想 。 大 概 地 说 ， 均 匀 散 列 设想 指出 所 有 可 能 的 键 的 集合 是 均 
习 分 布 在 所 有 表 索 引 的 集合 中 的 。 也 就 是 说 ， 每 个 键 是 以 同等 可 能 性 散 列 到 数组 的 任意 一 个 
索引 上 的 。 

对 所 有 的 应 用 来 说 ， 全 都 没有 满足 均匀 散 列 设想 的 hash_func 类 。 甚 至 函数 调用 运算 符 返 
aJunsigned iong 参 数 的 hash_func 类 也 不 是 一 个 好 的 选择 。 例 如 ， 假 设 键 是 一 个 9 位 的 雇员 编 
号， 其 中 最 右边 的 四 位 保存 了 雇员 工作 的 部 门 。 如 果 表 的 大 小 是 10 000， 并 且 当 前 应 用 中 的 
所 有 雇员 都 在 相同 部 门 工 作 ， 那 么 所 有 的 键 将 被 散 列 到 相同 的 索引 上 | 

hash_func 类 由 hash_map 的 用 户 决 定 ， 而 不 是 由 hash_map 类 的 开发 者 决定 。 

重要 的 是 ，hash_func 类 是 由 hash_map 类 的 用 户 决 定 的 ， 而 不 是 由 hash_map 类 的 开发 者 决 
定 的 。 用 户 知道 键 的 类 型 ， 并 能 大 概 了 解 将 键 转换 成 unsigned long 的 最 好 的 方式 。 在 
hash_map 类 中 ， 这 个 unsigned long 按 照 如 下 方式 转换 成 buckets 数 组 里 的 一 个 索引 (回忆 前 
面 ，length 字 段 保 存 了 桶 的 数量 ): 


int index=hash_func(key)%length; 


现在 讨论 一 下 buckets 数 组 应 当 有 多 大 。 如 果 hash_ map 类 开始 时 有 很 多 的 桶 ， 那 将 浪费 大 
量 的 窒 间 。 可 以 采用 一 个 保守 的 方法 来 代替 : 最 初 桶 的 数量 是 相当 小 的 一 一 即 211， 并 可 以 根 
据 情形 增加 。 什 么 时 候 增 加 呢 ? 因为 单独 的 列表 可 以 是 任意 大 的 ， 所 以 能 在 列表 数组 buckets 
里 存储 多 于 count(=size0) 的 项 ， 因 此 即便 count 接 近 length， 也 不 需要 重新 调整 大 小 。 但 是 如 果 
总 是 不 调整 大 小 ， 那 么 每 个 列表 的 平均 大 小 将 越 来 越 大 。 由 于 列表 的 查找 是 顺序 的 ， 所 以 
averageTime(n) 将 和 n 成 线性 关系 ， 而 我 们 的 目 标 是 获得 平均 情况 下 的 常数 时 间 花 费 。 

只要 加 载 因子 一 一 也 就 是 count 和 length 的 比值 一 一 超过 某 些 固定 值 ， 就 将 调整 大 小 . 这 个 
固定 值 的 定义 是 

const static float MAX RATIO; 


也 就 是 说 ， MAX_RATIO 是 扩充 buckets 数 组 之 前 count 和 length 的 最 大 比值 ,MAX RATIO 
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的 值 是 0.75， 因 此 如 采 (float)countlength>0.75， 融 将 进 # Wk. 这 确保 了 列表 的 平均 大 小 将 
是 很 小 的 ， 事 实 上 就 是 小 于 1.0 的 。 

当 调整 大 小 时 ， 数 组 中 的 每 一 项 必须 被 散 列 到 新 数组 中 ; 新 数组 中 项 的 索引 将 几乎 总 是 
和 它 在 旧 数 组 中 的 下 标 不 同 。 上 顺带 提 -- 下 ， 数 组 没有 选择 向 量 的 原因 是 为 了 进行 不 用 拷贝 的 
扩充 。 使 用 向量 ， 扩充 总 是 需要 将 旧 的 数组 拷贝 到 新 数组 的 相同 索引 中 ， 而 该 额外 的 、 无 用 
的 工作 将 降低 散 列 的 速度 。 | 

hash_map 方 法 的 定义 被 简化 了 ， 因 为 很 多 的 工作 在 list 类 的 方法 定义 过 程 中 就 已 经 完成 了 。 
例如 ，hash_map 类 中 insert 方 法 的 定义 包含 了 对 list 类 的 push_back 方 法 的 调用 。 但 是 即使 经 过 
了 简化 ，insert 方 法 的 定义 还 是 必须 处 理 错 综 复 杂 的 调整 大 小 问题 。 

hash_map 帮 代 缘 允许 我 们 访问 list 迭 代 器 ， 这 是 几 个 hash_map 方 法 定义 所 需要 的 。 因 此 先 
从 hash_map 类 的 能 入 式 iterator 类 的 字段 和 实现 开始 。 


13.3.4 iterator 类 的 字段 和 实现 


为 了 迹 代 通 过 一 个 hash_map 容 器 中 的 全 部 的 项 ，hash_map 迁 代 器 必须 能 达 代 通过 每 一 
列表 。 因 此 一 个 hash_map 迭 代 器 必须 包含 一 个 list 迭 代 器 才能 迭代 通过 一 个 列表 。 但 是 
hash_mapi& {tak PRERA — Piste A. WT Ze? 因为 当 hash_map 和 迭代 器 到 达 一 个 列表 尾 
部 上 是， 必须 能 到 达 下 一 个 列表 的 开头 。 为 了 克服 这 个 问题 ，hash_map 类 中 将 包括 当前 list 送 代 
更 的 信息 ， 还 有 该 列表 的 位 置 一 一 也 就 是 它 在 buckets 数 组 中 的 下 标 。 因 此 iterator 类 有 这 样 的 
两 个 字段 : 

unsigned index; 

list<value_type<const key type, T>>::iterator list. itr; 


还 需要 少量 的 字段 ， 因 为 一 个 迭代 器 需要 一 些 办 法 来 确定 当前 迭代 通过 的 是 哪 一 个 
hash_map 容 器 ,特别 是 哪 一 个 buckets 数 组 。 因 此 每 个 迭代 器 将 有 一 个 buckets 字 段 指 向 与 当前 
hash_map 容 器 的 buckets 字 段 相 同 的 数组 : 


list<value_type<const key_type, T>>* buckets: 
最 后 还 需要 判断 迭代 器 何 时 到 达 buckets 数 组 的 尾部 ， 因 此 和 迭代 器 类 将 包含: 


unsigned length; 


所 有 的 这 四 个 字段 将 在 hash_map 容 器 的 begin 方 法 中 获得 初始 值 ， 详 情 参 阅 13.3.5 节 。 
除了 operator++ 之 外 ， BVA ERAS RE AE T IURE T 89. 例如 : 


bool operator== (const iterator& other) const 
{ 
return (index == other.index) && 
(list itr == other.list itr) && 
(buckets == other.buckets) && 
(length — other.length) 


value type-const key type, T>& operator“ ( ) 
{ 
return "list itr; 


} // 运算 符 
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后 加 运算 符 从 调用 对 象 *this 的 保存 开始 ， 然 后 增加 list_itr 字 段 。 如 果 设 有 位 于 这 个 桶 的 
尾部 ， 就 返回 保存 的 迭代 右 。 否 则 就 继续 前 进 到 剩余 的 桶 ， 直 到 (除非 ) 找到 一 个 非 空 桶 。 
如 果 确 实 找到 了 一 个 非 空 桶 ， 就 将 list_itr 字 段 设 置 成 该 桶 的 开头 并 返回 保存 的 迭代 器 。 否 则 ， 
将 list_itr 字 段 设置 成 最 后 一 个 桶 的 尾部 并 返回 保存 的 迭代 器 。 

下 面 是 它 的 定义 : 

iterator operator+ + (int) 

{ 

iterator old itr = "this; 
if (+ list itr != buckets [index].end( )) 
return old itr; 
while (index « length — 1) 
{ 
index+ +; 
if (‘buckets [index].empty( )) 
{ 
list itr = buckets [index].begin( ); 
return old itr; 
) // SEES SK BES 
V/ while 
list. itr = buckets [index].end( ); 
return old itr; 
) // 后 加 运算 符 ++ 


这 个 方法 所 需要 的 时 间 花 费 将 在 实现 hash_map 类 之 后 进行 估算 。 
13.3.5 hash_map 类 的 实现 


现在 可 以 完成 hash_map 类 的 方法 定义 ， 从 构造 器 开始 : 
hash, map( ) 
{ 


count = 0; 

length = DEFAULT_SIZE; // = 211 

buckets = new list<value_type<const key type, T> > [DEFAULT. SIZE]; 
) / 缺 省 构造 器 


begin 方 法 查找 整个 buckets 数 组 ， 寻 找 一 个 非 空 的 位 置 


iterator begin( ) 
{ | 
int i = 0; 
iterator itr; 
itr.buckets = buckets; 
while (i < length — 1) 
{ 
if (buckets [i].empty( )) 


{ 
itr.list_itr = buckets [ij.begin( ); 








要 


itr.index = i; 
itr.length = length; 


return itr; 
) // buckets [i] 非 空 
j++: 
) // while 
itr.list itr = buckets [i]l.end( ); 
itr.index = i; 
itr.length = length; 
return itr; 


) // begin 
end 方 法 的 定义 要 简单 些 一 -返回 位 于 最 后 一 个 桶 中 最 后 一 个 位 置 的 下 一 位 置 的 迭代 器 : 


iterator end( ) 
{ 
int i = length — 1; 
iterator itr; 
itr.buckets = buckets; 532 
itr.list itr = buckets [i].end( ); 
itrindex = i; 
itr.langth = length; 
return itr; 
} // end 


现在 考虑 一 个 困难 的 方法 : insert。 在 正常 环境 下 ， 插 人 是 很 直接 的 。 要 插入 value_type< 
const key type, T» x， 首 先 查 明 x 是 否 已 经 在 hash_map 里 了 : 


iterator old itr; 

key type key = x.first; 
old itr — find (key); 

if (old itr != end( )) 


如 琳 那 样 将 只 是 返回 <old_itr, false> 对 。 否 则 ， 将 key 散 列 到 一 个 buckets 索 引 上 ， 把 x 洪 
加 进 该 列表 并 增加 count。 剩 下 的 工作 只 是 检测 是 否 必须 调整 buckets 数 组 的 大 小 ， 也 就 是 说 . 
如 采 count>int(MAX_RATIO*tength)。 出 于 模块 化 的 考虑 ， 这 个 子 任 务 将 在 辅助 方法 
check_for_expansion 中 处 理 。 

下 面 是 insert 的 定义 : 


pair<iterator, bool> insert (const value_type<const key_type, T>& x) 
{ 

iterator old itr; 

key type key = x.first; 


old itr — find (key); 
if (old itr != end( )) 

return pair <iterator, bool- (oid itr, false); 
int index = hash (key) % length; 





cA 





422 | RIIE 


buckets [index].push_back (x); 

count+ +; 

check_for_expansion( ); 

return pair<iterator, bool> (find (key), true); 
) // insert 


如 采 需 要 扩充 ， 那 就 创建 一 个 长 度 是 当前 数组 长 度 的 两 倍加 一 的 新 数组 。 当 前 数组 的 每 
一 项 都 被 重新 进行 散 列 ， 然 后 添加 进 新 数组 中 的 一 个 链表 里 ， 这 个 新 数组 随后 将 取代 旧 的 数 
组 。 最 后 ， 删 除 旧 数组 中 每 个 链表 里 的 每 一 项 。 

下 面 是 check_for_expansion 的 定义 : 


void check_for_expansion( ) 


{ 


list<value_type <const key type, T> >::iterator list itr; 
int index; 
if (count > int (MAX RATIO * length)) 
{ 
list< value_type<const key_type, T> >* temp_buckets = buckets; 
length = 2 * length + 1; 
buckets = new list< value_type <const key_type, T> > [length]; 
Key new_key; 
for (int i = 0; i < length / 2; i++) / 重新 散 列 旧 的 数值 
if (!temp_buckets [i].empty( )) 
for (list itr = temp_buckets [i].begin( ); 
list itr {= temp. buckets [i].end( ); 
list. itr-- +) 


new key = (“list_itr).first; 
index = hash (new. key) % length; 
buckets [index].push back (list itr); 
) // 将 temp_buckets[i] 存 回 桶 中 
/ 删除 旧 的 链表 
for (int i = 0; i < length / 2; i++) 
if (!temp_buckets [i].empty( )) 
temp_buckets [i].erase (temp_buckets (i].begin( ), 
temp. buckets [i].end( )); 


delete[ ] temp. buckets; 
RBA AM 
)// 方法 check for expansion | | 
如 果 进 行 了 扩充 ， 那么 buckets 数 组 的 长 度 将 被 改变 ， 因此 必须 重新 计算 每 个 键 所 对 应 的 
索引 。 结果 是 调整 大 小 前 在 同一 个 链表 里 的 项 在 调整 之 后 可 能 位 于 不 同 的 链表 里 ， 例如 ， 假 
设 数组 的 长 度 在 调整 大 小 之 前 是 48。 那么 键 为 63 和 111 的 项 将 在 桶 [15] 的 链表 里 。 调 整 大 小 之 
后 ， 大 小 变 为 97; 键 为 63 的 项 将 在 桶 [63] 的 链表 里 ， 而 键 为 111 的 项 将 在 桶 [14] 的 链表 里 。 
我 们 将 把 对 insert 方 法 (以 及 check_for_expansion 方 法 ) 的 分 析 推 迟到 开 发 find 和 erase 方 
法 之 后 再 进行 。 
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与 insert 方 法 相 比 ，find 方 法 更 容易 些 : 利用 通用 型 算法 find 查 找 列表 ( 即 桶 )， 找 到 键 散 
列 的 索引 。 如 果 返 回 的 列表 和 迭代 右 与 end(0 方 法 返回 的 夺 代 恬 不 同 ， 就 将 buckets_ptr 和 index 宁 
段 填 充 进 一 个 新 创建 的 迭代 器 里 并 返回 该 迭代 器 。 

下 面 是 代码 : 

iterator find (const key_type& key) 


{ 
int index = hash (key) % length; 
iterator itr; 
itr.list itr = std::find (buckets [index].begin( ), buckets [index].end( ), 
value type «const key. type, T> (key, T( ))); 
if (itr.list itr = = buckets [index].end( )) 
return end( ); 
itr.buckets = buckets; 
it.index = index; 
itr.length = length; 
return itr; 
) // find 


这 里 指定 了 std::find， 它 强调 了 调用 的 是 通用 型 算法 find， 而 不 是 hash_map 的 find 方 法 。 
erase 方 法 的 定义 就 更 简单 了 : 


void erase (iterator itr) 

{ 
buckets [itr.index].erase (itr.list_itr); 
count--; 

) // erase 


hash_map 类 中 的 关联 数组 运算 符 operator[ 的 定义 和 第 10 章 中 map 类 中 同类 运算 符 使 用 了 
同样 的 单行 语句 (除了 value_type 不 是 <const key. type, T> 对 的 缩写 外 ): 


T& operator[ ] (const key_type& key) 
{ 


return (*((insert(value_type<const key type, T> (key, T( )))).first)).second; 


) // 运算 符 [ ] 
完整 的 hash_map 类 可 以 参阅 本 书 网 站 的 源 代码 链接 。 
13.3.6 链 式 散 列 分 析 


现在 进行 均匀 散 列 设想 。 也 就 是 说 ， 假 设 每 个 键 独立 于 其 他 键 的 散 列 ， 以 同等 几率 散 列 
到 数组 的 任意 一 个 索引 上 。 

如 果 使 用 链 式 散 列 并 满足 了 均匀 散 列 设想 ， 那 么 成 功 或 失败 查找 的 平均 时 间 花 帝都 是 常数 

令 n=count，m=length= 桶 的 数量 = 列表 数量 。 如 果 均 匀 散 列 设想 成 立 ， 那么 "个 项 将 相当 
均匀 地 分 布 到 m 个 列表 里 ， 列 表 的 平均 大 小 是 n/m。 那 么 时 间 估 算 将 依赖 于 n 和 mm。 Ar JE: 
MAX RATIO-0.75, H idi d: 


nim & 0.75 
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每 个 列表 的 平均 大 小 至 多 契 0.75。 那 么 平均 情 次 下 查找 一 个 列表 将 需要 至 多 0.75 次 迭代 。 


也 就 是 说 find 方 法 航 averageTimes(n, m)fllaverageTime,(n, m) 都 是 常数 。 


Un 


图 13-5 总 结 了 链 式 散 列 的 查找 时 间 估 算 。 在 每 次 近似 中 ， 时 间 不 是 依赖 于 上 ， 而 是 依赖 于 
7z/ 妨 的 比值 。 图 13-6 估 算 了 使 用 不 同 mwmr 比 值 的 成 功 和 失败 查找 的 循环 迭代 次 数 。 在 图 13-5 和 
图 13-6 的 两 个 表 里 都 假定 均匀 散 列 设想 成 立 。erase 方 法 的 分 析 也 是 相同 的 ， 不 论 在 成 功 或 失 
败 的 情况 下 ， 删 除 每 个 项 的 平均 时 间 花 费 都 是 常数 。 

insert 方 法 怎么 样 呢 ? 对 插入 而 言 ， 可 能 需要 对 付 扩 充 。 只 要 扩充 buckets 数 组 ， 它 的 长 度 
将 加 倍 (再 加 1)， 因 此 桶 将 不 会 被 扩充 ， 直 到 n 的 大 小 再 次 加 倍 。 也 就 是 说 ， 每 2n 次 插入 只 进 
行 一 次 扩充 ， 因 此 averageTime(n,m) 仍 是 常数 ， 事 实 上 amortizedTime(n,m) 也 是 常数 。 实 际 说 
来 ， 当 发 生 扩充 时 ， 该 常数 将 可 能 非常 大 。 其 他 的 技术 ， 像 渐进 式 扩 充 和 延伸 式 扩充 ， 每 次 
只 是 为 数组 增加 一 个 小 的 量 并 避免 大 范围 的 重新 散 列 和 重新 插入 。 延 伸 式 散 列 的 讨论 见 
Heileman(1996,pp.232-233)。 

对 iterator 类 中 的 operator++， 首 先 计算 迭代 的 总 次 数 并 将 这 个 总 和 除 以 4。 为 了 遍历 整 
个 buckets 数 组 ， 访 问 每 个 项 共 需 要 n 次 迭代 ， 访 问 m 个 链表 共 需 要 m 次 迭代 ， 总 共 是 n+tm 次 兴 
代 。 假 设 MAX_RATIO=0.75， 那 么 当 n > 3m/4 时 将 调整 buckets 的 大 小 ， 并 且 在 调整 之 后 ，m 的 
新 值 将 会 是 它 的 旧 值 的 两 倍 (近似 值 )。 等 价 地 讲 ， 在 调整 之 后 ，m 的 旧 值 将 是 新 值 的 一 半 ，。 
那么 在 第 一 次 调整 大 小 之 后 ， 总 是 有 3(m/2)/4 < n。 因 此 n+m < n+8n/3<4n。 夫 代 的 平均 次 数 是 
忆 次 数 除 以 4x， 因此 operator++ 的 平均 迭代 次 数 小 于 4。 也 就 是 说 ，averageTime(n,m) 是 常数 。 


链 式 : 


averageTime,(n, m) = Fe, 次 选 代 





averageTime,,(n, m) = 77 D XA 


图 13-5 使 用 链 式 散 列 的 成 功 和 失败 查找 的 平均 时 间 估算 汇总 ， 采 用 了 均匀 
散 列 设想 。 在 图 中 ，n= 插 入 值 的 数量 ; m=length= 桶 的 数量 = 列表 数量 


0.5 0.75 75 | 0.90. 
FN 0.13 | 0.25 | 0.38 | 0.45 o» 50 
Unsuccessful | 0.25 | 0.50 | 0.75 | 0.90 | 0.99 


图 13-6 链 式 散 列 下 ， 不 同 n/m 比 值 对 应 的 查找 时 间 (近似 的 循环 选 代 次 数 ) 估算 ， 
这 个 图 没有 假定 MAX_RATIO=0.75。 事 实 上 ，MAX_RATIO 其 至 可 以 大 于 1 


最 坏 时 间 花 费 至 今 我 们 一 直 忽 略 了 对 最 坏 时 间 花 费 的 讨论 。 这 是 散 列 的 致命 弱点 ， 就 好 
像 最 坏 时 间 花 费 是 快速 排序 中 最 容易 受 攻击 的 方面 一 样 。 不 论 均 勺 散 列 设想 满足 与 否 ， 都 仍 
然 会 有 一 个 数据 集合 ， 其 中 有 许多 键 散 列 到 相同 的 索引 上 ， 导致 查找 的 迭代 次 数 和 n 成 线性 关 
系 。 因 此 成 功 或 失败 查找 的 worstTime(%,m) 都 和 a 成 线性 关系 。 根 据 相同 的 原因 ， 可 以 证 明 
insert 和 erase 方 法 的 worstTime(n,m) 与 find 方 法 的 一 样 ， 都 和 n 成 线性 关系 。 

PRR ARAMA, RICH DRAM REE, A KKM SRY KOC C Ren ELA 
性 关系 。 

operator++ 在 最 坏 情 况 中 ，buckets[0] 里 将 包含 n- 1 项 ， buckets[m 一 1] 里 将 包含 1 项 。 前 进 
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到 这 最 后 一 项 将 需要 While 循 环 的 m1 次 达 代 ， 因 此 operator++(int) 和 的 worstTime(n,m) 和 mm 成 
底线 是 : 除非 确信 均匀 散 列 设想 对 应 用 中 的 键 空间 是 合理 和 的， 并且 我 们 主要 关心 的 是 平 
均 情 况 下 的 性 能 ， 否 则 就 使 用 map 容 器 ， 以 保证 最 坏 情 况 下 能 获得 对 数 时 间 。 


13.3.7 value_type 类 


每 个 列表 中 的 项 都 是 value_type 类 型 的 ， 并 且 到 目前 为 止 可 能 都 假定 value_type 的 定义 是 : 
typedef pair<const key_type, T> value_type; 


这 正 是 第 10 章 中 value_type 在 map 类 里 的 定义 。 那 么 在 hash_map 类 中 应 当 有 什么 差别 
We? 有 差别 的 原因 是 hash_map 类 调用 了 list 类 的 方法 。 例 如 ，hash_map 类 的 find 方 法 中 的 -- 
条 语句 是 : 

itr.list itrzstd::find(buckets[index].begin(), buckets[index].end(), 

value type«const key type, T»(key,T())); 


这 个 语句 搜寻 了 一 个 列表 ， 但 是 pair 类 没有 用 operator== 作 为 列表 中 项 比较 的 根据 。 注 
意 比 较 应 当 只 使 用 第 一 个 组 件 ， 也 就 是 键 。 

解决 这 个 问题 的 一 种 方案 是 令 value_type 成 为 一 个 模板 化 的 结构 ; value_type 将 重 载 
operator==。 下 面 是 value_type 结 构 : 


template<class key, class T> 
struct value_type 
{ 
public: 
value_type (const value_type& p): first (p.first) 
{ 


second = p.second; 
} 


value_type (const key& key, const T& t): first(key) 
{ 


second = t; 


} 


bool operator == (const value type& x) 


{ 
return first == x first; 
}i 运算 符 == 
key first; 
T second; 
y; // value_type ła 


在 构造 器 中 ， 构 造 器 初始 化 部 件 (参阅 6.1.4 节 ) 避免 了 为 const 字 段 赋值 的 问题 。const 
字段 必须 在 进入 构造 器 体 之 前 初始 化 ， 这 也 正 是 需要 构造 器 初始 化 部 件 的 原因 。 


13.3.8 应 用 
毫 不 费力 就 可 以 找到 散 列 的 应 用 。 在 第 10 章 中 开发 了 一 个 程序 ， 计 算 文 本 中 每 个 单词 的 
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频率 。 程 序 借助 一 个 map 容 器 保存 < 单词 ， 频 率 > 形 式 的 对 。 通 过 用 一 个 hash_map 窑 絮 赫 换 
map 容 器 ， 可 以 充分 减少 平均 时 间 花 费 : 


#include "hash. map1.h" 
typedef hash mapc« string, int, hash func > FrequencyMap; 


FrequencyMap frequencies; 


并 且 第 三 个 模板 变 元 现在 是 一 个 散 列 国 数 类 。 由 于 使 用 了 一 个 hash_map 容 器 ， 所 以 输出 
文件 将 不 会 是 按照 字母 顺序 的 : 


program 1 
of 2 

al 

text 2 
words 3 
big 1 
many 1 
counts 1 
this 1 

in 2 
occurrences 1 
number 1 
the 2 

it 1 

may 1 
have 1 
including 1 


这 个 顺序 基于 单词 散 列 的 数组 下 标 。 为 了 使 输出 文件 按照 单词 的 字母 顺序 排列 ， 迭代 通 
过 frequencies 并 将 每 个 <string, int> 对 插入 map 容 器 : 


map<string, int^s frequencies; 
mapc string, int>::iterator s itr; 


for (itr = frequencies.begin( ); itr != frequencies.end( ); itr+ +) 
s, frequencies.insert (pair «string, int ((‘itr).first, (*itr).second)); 
for(s itr = s frequencies.begin( ); s itr !- s frequencies.end( ); s_itr++ ) 
out file << (*s_itr).first << " " << (*s_itr).second << endl: 


很 奇怪 的 是 ， 将 单词 -频率 对 按照 字母 顺序 输出 (averageTime(n) 是 O(nlogn)) 将 比 先 创建 
这 些 对 (averageTime(n) 只 是 O(n)) 花费 更 长 的 时 间 。 


举 一 个 非常 重要 的 例子 ， 让 我 们 重新 考虑 实验 19 中 开发 的 前 缀 转换 成 后 RN RF. dE 
Compiler% H 4g J: 


“vector<string> symbolTable;. 
稍 后 在 Token 类 (Compiler) Jr) 中 有 : 


index = find (symbolTable.begin( ), symbolTable.end( ), referent) 
~ symbolTable.begin( ); 
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if (index == symbolTable.size( )) 

symbolTable.push, back (referent); 

这 个 symbolTable 的 查找 在 最 坏 和 平均 情况 下 都 花费 O(n) 时 间 ， 因 为 symbolTable 是 一 个 
vector 容 右 。 通 过 用 一 个 map 容 器 替换 vector 容 器 ， 可 以 将 平均 和 最 坏 情 况 的 时 间 花 费 减少 到 
OUogm)。 如 采用 一 个 hash_map 容 器 替换 vector 容 器 ， 平 均 时 间 花 费 将 减少 到 O(1)， 但 是 最 坏 
时 间 花 费 是 O(n)。 这 显示 了 在 map 容 器 和 hash_map 容 器 之 间 的 一 个 平衡 。 在 这 个 应 用 里 ， 平 
均 时 间 化 费 是 至 关 紧 要 的 ， 因 此 hash_map 容 器 总 是 不 变 的 选择 。 则 样 ， 平 均 时 间 和 最 坏 时 间 
的 平衡 考虑 使 得 快速 排序 成 为 系统 排序 应 用 程序 中 所 有 排序 方法 的 首选 。 

散 列 对 磁盘 文件 的 直接 访问 也 是 很 有 用 的 。 当 一 个 键 被 散 列 到 一 个 文件 位 置 上 时 ， 只 锯 
要 一 次 柱 面 访 问 就 可 以 将 整个 桶 引入 内 存 。 保 持 最 少 的 柱 面 访问 是 文件 处 理 的 主要 日 的 ， 因 
为 每 次 柱 面 访问 都 需要 机 电 臂 在 磁盘 上 的 移动 。 

在 实验 28 中 将 对 比 hash_map 容 器 和 map 容 器 的 运行 时 间 速 度 。 


实验 28: hash_map 计 时 (所 有 实验 都 是 可 选 的 ) 


13.4 hash_set 类 


使 用 散 列 ， 所 有 的 工作 都 涉及 到 键 -索引 的 关系 。 如 果 值 只 由 键 或 者 还 有 另 一 个 组 件 组 成 
古 没 什么 问题 的 。 在 前 一 种 情况 里 ， 有 hash_set; 而 在 后 一 种 情况 里 则 有 hash_map。 开 发 
hash_set 类 是 相当 直截了当 的 。 事 实 上 ， 可 以 将 hash_set 看 作 一 个 hash_map， 其 中 的 非 键 字段 
被 忽 上 咯 。 根 据 这 个 观点 ，hash_set 类 中 有 一 个 hash_map 字 段 。 下 面 是 简单 的 实现 : 

template<class Key, class HashFunc > 

class hash_set 


{ 


class T{ }: 


hash_map<Key, T, HashFunc> my_hash_map; 


iterator find(const key_type& x) const { return my_hash_map.find(x); } 
) // 类 hash_set 


现在 可 以 重 做 第 9 章 的 拼写 检查 应 用 程序 ， 但 是 用 hash_set 容 器 替换 AVLTree 容 器 。 假 设 均 
匀 散 列 设 想 成 立 ， 则 令 m 代 表 字 典 文件 的 大 小 ， 并 令 k 代 表 文档 文件 的 大 小 。 每 次 在 字典 文件 
中 查找 一 个 给 定单 词 平均 只 花费 常数 时 间 ， 因此 hash_set 版 本 的 compare 方 法 的 averageTime(k， 
n) 和 k 成 线性 关系 ; 回想 一 下 ， 这 个 方法 的 AVLTree 版 本 的 averageTime(k， n) 是 O(klogn)。 综 合 
结 采 是 hash_set 版 本 的 compare 方 法 的 worstTime(K， n) 是 O(kn)， 而 AVLTree 版 本 的 该 时 间 花 费 
则 是 O(klogn)。 

13.5 市 探讨 了 另 一 个 避免 使 用 链表 的 冲突 处 理 程序 。 


13.5 开放 地 址 散 列 
使 用 链 式 处 理 冲 突 的 基本 思想 是 : 当 一 个 键 被 散 列 到 buckets 数 组 中 的 一 个 指定 索引 上 时 
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该 键 的 值 将 被 插 人 到 buckets[index] 上 链表 的 尾部 。 


使 用 开放 村 址 处 理 冲 突 是 通过 在 表 中 查找 一 个 空 (也 就 是 “开放 ”) 的 单元 。 
开放 导 址 提供 了 另 一 种 方法 来 处 理 冲 突 。 使 用 开放 寻 址 ， 每 个 表单 元 只 包含 一 个 值 ， 没 
有 和 链表。 要 插入 一 个 值 ， 如 果 该 值 的 键 被 散 列 到 包含 了 不 同 键 的 索引 上 ， 那 么 将 系统 地 查找 


表 的 剩余 部 分 ， 直 到 找到 一 个 空 的 也 就 是 “开放 的 ”单元 。 


最 简单 的 开放 寻 址 策略 是 使 用 1 作为 偏 移 量 。 也 就 是 说 , 插入 一 个 键 被 散 列 到 索引 上 的 值 ， 
那么 该 值 就 被 插入 到 这 里 。 否 则 就 调查 索引 j+1， 然 后 是 索引 jt+2，、 等 等 ， 
直到 找到 一 个 开放 的 位 置 。 图 13-7 显 示 了 插入 下 列 值 时 创建 的 表 : 


an buckets[j] 2972 , 


214-30-3261 
033-51-8000 


图 13-7 插入 八 个 值 的 表 。 使 用 偏 移 量 为 1 的 开放 寻 址 方式 来 处 理 冲突 


0 
1 


033-5 1-8000 
214-30-3261 
819-02-9261 


033-30-8262 
214-17-0261 


? 
? 
? 

? 
214-19-9528 
? 

? 

? 

? 








260 
261 
262 
263 
264 
265 








527 
528 
529 
530 


819-02-9528 


215-09- 1766 


765 
766 
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0 


214-19-9528 
819-02-9528 
8 19-02-9261 
033-30-8262 
215-09-1766 
214-17-0261 


为 了 判断 一 个 单元 是 否 被 占用 ， 


value_type 类 将 使 用 一 个 bool 字 段 occupied。 当 构造 一 


散 列 映射 时 ， 表 中 每 个 值 的 occupied 字 有 段 将 被 设置 成 false。 当 insert 方 法 将 一 个 值 插入 表 中 时 ， 


该 值 的 occupied 字 段 就 被 设置 成 true。 图 13-8 显 示 了 在 图 13-7 的 表 上 加 入 这 个 字段 后 的 结 来 。 


EN Occupied 
| 033-51-8000 | 51-8000 










260 Lt | ae | | false | 
EI 


214-17-0261 


false 


928 | 214-19-9528 
529 | 819-02-9528 | 819-02- | 819.02-0528 | 


false 








766 


215-09-1766 


99| 7? | | false | 







图 13-8 在 表 中 插入 儿 个 值 后 的 结果 : 播 人 的 每 个 值 对 应 的 occupied 字 段 被 设置 成 true 
下 面 是 开放 寻 址 的 两 个 小 细节 : 
1) 为 了 确保 在 有 开放 单元 可 用 时 能 找到 它 ， 表 必须 是 环绕 式 的 : 如 果 索 引 length-1 上 的 单 
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元 不 是 开放 的 ， 那 么 下 一 个 尝试 的 索引 是 0。 

2) 条 目的 数量 不 能 超过 数组 长 度 ， 因 此 加 载 因子 不 能 超过 1.0。 当 数组 总 是 有 至 少 一 个 开 
放 ( 即 空 的 ) 单元 时 ， 它 将 简化 find、insert 和 erase 方 法 的 实现 并 提高 它们 的 效率 ; 因此 需要 
严格 限制 加 载 因 子 小 于 1.0。 回 忆 一 下 ， 链 式 索 引 的 加 载 因子 是 可 以 超过 1.0 的 。 

现在 考虑 使 用 开放 寻 址 且 偏 移 量 为 1 的 hash_map 类 的 设计 和 实现 所 涉及 的 内 容 。 我 们 将 引 
用 链 式 散 列 设计 的 全 部 字段 : buckets、count、length 和 hash， 但 是 buckets 将 是 一 个 值 数 组 ， 而 
不 是 值 列表 的 数组 。 同 样 ， 艇 入 的 iterator 类 也 将 包含 和 链 式 散 列 相同 的 first 和 second 字 段 ， 还 有 
occupied 字 段 。find、insert 和 erase 方 法 必须 重新 定义 ， 因 为 这 些 方法 的 链 式 版 本 都 访问 了 链表 。 


13.5.1 erase 方 法 


在 定义 find 和 insert 方 法 之 前 ， 需 要 先 定义 erase 方 法 ， 因 为 删除 值 的 细节 对 查找 和 删除 会 
有 微妙 的 影响 。 这 个 意思 是 说 ， 假 设 希 望 从 图 13-8 的 表 中 删除 键 为 214-30-3261 的 值 ， 如 果 只 
是 将 该 值 的 occupied 字 段 设 置 成 false ， 那么 将 得 到 图 13-9 所 示 的 表 。 


key occupied 


033-51-8000 


ae 
[sees | tue 
[ox3o89 | Wwe | 
Tamaros | true | 
[ Tess | we 
[952595 | tue | 


[3975 | wwe | 


图 13-9 将 图 13-8 的 表 中 键 为 214-30-3261 的 值 的 occupied 
字段 设置 成 false， 删 除 该 值 之 后 的 结果 











false 














999 
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发 现 这 个 删除 策略 的 缺陷 了 吗 ? 214303261 的 同义词 所 取 的 路 径 被 阻塞 了 。 查 找 键 为 

819029261 的 值 将 失败 ， 因 为 find 方 法 一 旦 遇 到 一 个 occupied=false 的 值 就 会 停止 。 为 了 避免 
这 个 问题 ， 在 value_type 类 里 添加 另 一 个 字段 : 

bool marked for removal; 

当 一 个 值 插入 表 的 桶 中 时 ， 该 字段 被 初始 化 为 false。erase 方 法 将 该 字段 设置 成 true。 洒 
marked_for_removal 字 段 为 true ， 说 明 它 的 值 不 再 是 散 列 映射 的 一 部 分 ， 但 是 允许 1- 偏 移 的 
冲突 处 理 程序 沿 着 它 的 路 径 继 续 下 去 。 图 13-10 显 示 了 进行 过 八 次 插入 之 后 的 表 ， 图 13-11 显 示 
了 “删除 ” 键 为 214303261 的 项 之 后 的 结 来 。 












key occupied | marked for removal 
of 033518000 | tue | false 
tf? | fase | — fale — — 
260| — 7? | fale | fase | 


033-30-8262 
214-17-0261 

false 
214-19-9528 


819-02-9528 


215-09-1766 


? 
false 


图 13-10 播 入 八 个 值 后 的 表 。 使 用 1- 偏 移 的 开放 寻 址 方式 来 处 理 冲 突 。 在 每 个 值 中 ， 
只 显示 了 key (也 就 是 first)、occupied 和 marked_for_removal 字 段 


现在 键 为 819029261 的 值 的 查找 将 是 成 功 的 。 因 为 erase 方 法 的 参数 是 一 个 选 代 器 ， 该 迭代 


false 


766 faise 









999 false 
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器 的 索引 字段 提供 了 对 即将 删除 的 值 的 访问 。 定 义 如 下 : 


void erase (iterator itr) 
{ 
buckets [itr.index].occupied = false; 
buckets [itr.index].marked for removal = true; 











count--; 
) // erase 

key occupied | marked for. removal 
O | 03-5800 | true | false 
1|? | fase | fase | 
20 | — ? — | fase | false 
262 | 81902926! | true | ^ fale — 
265| — — 7? | fale | fase — 
527 false 
999 

$43 图 13-11 发 送 消息 erase(214303261) 之 后 图 13-10 中 表 的 内 容 


544 开发 完 find 和 insert 方 法 之 后 再 来 分 析 erase 方 法 。 
find 方 法 不 断 进行 循环 ， 直 到 找到 一 个 未 占用 的 单元 或 匹配 的 键 。 只 有 当 一 个 值 没有 删除 
标记 时 才 检 测 该 值 的 键 。 定 义 如 下 : 


iterator find (const key_type& key) 





i 


unsigned long hash_int = hash (key); 

int index = hash_int % length; 

iterator itr; 

while (buckets [index].marked for. removal 

| (buckets [index].occupied && buckets [index].first != key)) 

index = (index + 1) % length; | 

if ('buckets [index].occupied && !buckets [index].marked, for removal) 
return end( ); 

itr.buckets = buckets; 


itr.index = index; 
itrlength = length; 
return itr; 

) // find 


ARR | — f e FR FF f ER: [EL J marked. for removal7g 75; X. 对 check_for_expansion 方 法 提出 
了 一 个 问题 。 问 题 是 确定 重新 散 列 的 适当 条 件 。 先 从 链 式 散 列 使 用 的 条 件 开始 : 
count>int(MAX_RATIO*length) 


使 用 这 个 条 件 决定 是 否 用 开放 寻 址 重新 散 列 是 错误 的 ， 假 设 length 字 段 是 1000 并 进行 大 量 
的 交叉 插入 和 删除 。 例 如 ， 假 定 有 980 次 插入 和 780 次 删除 。 那 么 count 字 段 值 将 是 200， 显然 
表 中 还 将 剩余 大 量 的 空间 。 但 将 只 有 20 个 未 占用 的 单元 。 那 么 使 用 find 方 法 的 平均 情况 下 的 失 
败 杏 找 将 需要 多 于 15 次 循环 迭代 。 这 是 难以 接受 的 。 

解决 的 方法 是 ， 只 要 count 的 值 加 上 最 近 删 除 的 次 数 超过 MAX_RATIO*length， 就 重新 散 
列 。 最 近 ” 的 删除 代表 着 自 length 值 最 后 一 次 改变 之 后 所 发 生 的 删除 。 这 个 解决 方法 需要 在 
hash_map 类 里 添加 一 个 count_plus 字 段 : 

int count_pius;Wcount 值 + 自 length 最 后 一 次 改变 后 删除 的 次 数 


当 count_plus 的 值 超过 MAX_RATIO*length 的 阔 值 时 将 重新 进行 散 列 。 我 们 不 需要 将 
marked_for_removal 值 插入 新 表 ， 因 为 将 为 插入 的 值 创建 新 的 路 径 ; 也 就 是 说 ， 将 重新 开始 。 
因此 在 重新 散 列 之 后 ，count 的 值 将 被 赋 给 count_plus。 从 这 时 直到 下 一 -次 重新 散 列 ， 每 插入 
一 个 值 就 增加 count 和 count_plus 字 段 ， 不 过 每 删除 一 个 值 就 减少 count 字 段 。 (习题 13.7 考 虑 了 
一 种 可 行 的 改进 : 当 count 的 值 超过 MAX_RATIO*length 时 重新 散 列 并 且 表 的 大 小 加 倍 : 当 
count_plus 的 值 超过 MAX_RATIO*length 时 重新 散 列 但 不 改变 表 的 大 小 。) 

下 面 是 check_for_expansion 方 法 的 定义 : 


void check_for_expansion( ) 


{ 
unsigned long hash int; 
int index, 
offset, 
old length; 


if (count plus > int (MAX RATIO * length)) 
{ 


tn 


cn 
-] 





548 





434 PIF 


value type«key type, T>*temp_buckets = buckets; 


old_length = length; 
length = next prime (old length); 
buckets = new value type«key type, T> [length]; 
for (int i = 0; i « old length; i+ +) 
if (temp. buckets [i]J.occupied) 
{ 
hash int = hash (temp_buckets [i].first); 
index = hash int % length; 
while (buckets [index].occupied) 
index = (index + 1) % length; 
buckets [index] = temp_buckets [i]; 
) // $temp. buckets[i] 3X [n] f rn 
delete[ ] temp buckets; 
count plus — count; 
) / 桶 的 大 小 加 倍 
) // 方法 check_for_expansion 


下 面 是 insert 方 法 的 定义 : 


pair<iterator, bool> insert (const value_type<const key_type, T>& x) 
{ 
key type key = x.first; 
unsigned long hash int — hash (key); 
int index = hash int % length; 
while ((buckets [index].marked for removal) 
buckets [index].occupied && key != buckets [index].first) 
index = (index + 1) % length; 
if (buckets [index].occupied && key == buckets [index]. first) 
return pair <iterator, bool> (find (key), false): 
buckets [index].first = x.first: 
buckets [index].second = x.second: 
buckets {index].occupied = true; 
buckets [index].marked for removal = false; 
count+ +; 
count plus- 十 ; 


check for expansion( ); 
return pair<iterator, bool> (find (key), true); 
) // insert 


由 于 在 count_plus 的 值 超过 MAX_RATIO*length 时 将 重新 散 列 ， 并 且 需 要 MAX_RATIO 的 
值 严格 限制 在 1.0 之 内 ， 所 以 在 表 中 至 少 总 有 一 个 位 置 是 未 占用 且 没 有 删除 标记 的 。 结 果 是 ， 
find 方 法 中 的 white 特 环保 证 了 最 后 的 终止 。 


13.5.2 {RX 


1 一 偏 移 冲突 处 理 程序 仍旧 有 一 个 恼人 的 特点 ; 所 有 散 列 到 给 定 index 上 的 键 将 探查 相同 的 
Mír: index, index+1, index42, 2%, gg, 所 有 散 列 到 该 路 径 上 任 一 索引 的 键 也 将 











ETT GEN 


沿 着 该 索引 之 后 的 相同 路 径 。 例 如 ， 图 13-12 显 示 了 图 13-10 中 的 部 分 表 。 在 图 13-12 中 ， 散 列 
4/261 A BEAD Pe 7A A261, 262, 263, 264- tr yl #262 4) BE AD BS 12536262, 263, 264, 
265…… 往 是 非 空 单元 的 序列 。 使 用 !- 偏 移 冲突 处 理 程序 ， 复 是 由 同义词 构成 的 ， 包 括 不 同 
冲突 的 同义词 。 在 图 13-12 中 ,索引 261、262、263 和 264 上 的 单元 组 成 了 一 个 焦 。 每 当 -一 个 条 
目 添加 进 簇 ， 该 做 不 仅 变 大 ， 而 且 成 长 得 更 快 ， 因 为 任何 散 列 到 新 索引 上 的 键 将 沿 着 焦 中 已 
存储 的 键 的 相同 的 路 径 。 主 聚 类 是 当 冲 突 处 理 程序 允许 加 速 得 成 长 时 发 生 的 现象。 

主 聚 类 出 现在 开放 寻 址 冲突 处 理 程序 允许 加 速 族 成 长 时 。 

显然 ，1- 偏 移 冲突 处 理 程序 是 易 受 主 聚 类 影响 的 。 主 聚 类 存在 的 问题 是 在 查找 、 插 入 和 
出 除 的 过 程 中 顺序 遍历 的 是 不 断 增长 的 路 径 。 长 的 顺序 遍历 是 散 列 的 祸根 ， 因 此 应 设法 避免 
这 个 问题 . 

如 果 选 择 20 作 为 偏 移 量 而 不 使 用 1 作为 偏 移 量 会 怎么 样 呢 ” 我 们 仍然 将 得 到 主 聚 类 ， 散 列 
到 index 上 的 键 将 重 登 散 列 到 index+20、index+40 等 索引 处 的 键 的 路 径 上 。 事 实 上 ， 这 会 引起 
比 主 聚 类 更 大 的 问题 ! 例如 ， 假 设 表 的 大 小 是 100 并 且 偏 移 量 是 20。 如 果 一 个 键 被 散 列 到 33. 
那么 只 有 下 列 索 引 的 单元 才 允 许 出 现在 该 秘 中 : 

33 53 73 93 13 


一 旦 填 满 了 7 这些 单 元 ， 那 么 就 不 能 再 插入 任何 散 列 到 这 些 索 引 上 的 键 对 应 的 值 。 出 现 这 
额外 问题 的 原因 是 偏 移 和 表 的 大 小 有 一 个 公 因子 。 令 表 的 大 小 为 素数 可 以 避免 这 个 问题 ， 但 
征 仍 有 主 聚 类 的 问题 。 





occupied marked_for_removal 


key 

260) 2 

262 | 819-02-9261 - 
9 


265 | 






图 13-12 散 列 到 261 的 刍 的 路 径 重 登 了 散 列 到 262、263、264 的 键 的 路 径 


! 一 候 移 〈 或 任何 线性 偏 移 ) 冲突 处 理 程序 导致 主 聚 类 问题 的 原因 是 由 于 任何 键 的 偏 移 都 
是 相同 的 。13.5.3 节 中 解答 了 主 京 类 的 问题 ， 令 每 个 键 不 仅 确定 索引 ， 而 且 还 确定 偏 移 量 。 


13.5.3 WHA 


如 采 使 偏 移 量 依赖 于 键 而 不 是 所 有 的 键 使 用 相同 的 偏 移 ， 那么 主 聚 类 的 问题 是 可 以 避免 
的 。 例 如 ， 可 以 设置 


offset=hash_int/length; 
要 了 解 佳 简单 的 环境 中 这 是 如 何 工作 的 ， 加 大 小 为 19 的 表 中 插入 下 列 键 : 
33 


72 
71 


in 
c 








436 p13* 


55 

112 

109 

这 些 键 的 创建 不 是 随机 的 ， 不 过 可 以 说 明 ， AI] tb Se E E FAIR] Ope A SEC zx EUER IR] 
的 路 径 。 下 面 是 相应 的 余数 和 商 : 


键 键 %19 键 /19 
33 14 ] 
72 15 3 
71 14 3 
112 17 5 
55 17 2 
109 14 5 





第 一 个 键 33 被 存储 在 索引 14， 而 第 二 个 键 72 被 存储 在 索引 15。 第 三 个 键 71 散 列 到 14， 但 
是 该 单元 已 被 占用 ， 因 此 索引 14 加 上 偏 移 3 得 到 索引 17，71 就 被 存储 到 这 个 单元 里 。 第 四 个 键 
112 散 列 到 17 (已 占用 )， 索 引 17 加 上 偏 移 5; 因为 22 已 经 超出 了 表 的 范围 ， 所 以 用 22%19， 即 


后 散 列 到 (17+2)%19， 即 空 单元 0。 第 六 个 键 109 散 列 到 14 (已 占用 )， 然后 散 列 到 
(14+5) %19, BNO (已 占用 )， 然 后 是 (0+5) %19， 即 一 个 未 占用 的 单元 5。 图 13-3 显 示 了 这 
些 插入 之 后 的 结果 ，。 





图 13-13 向 表 中 插入 六 个 值 的 结果 ; 冲突 处 理 程序 使 用 散 列 值 和 表 大 小 的 商 作为 偏 移 
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这 个 冲突 处 理 程序 是 著名 的 双 散 列 ( 因为 索引 和 偏 移 都 是 通过 散 列 键 获得 的 )， 或 者 称 作 
商 - 偏 移 冲 突 处 理 程序 。 在 接触 代码 和 分 析 之 前 还 需要 处 理 最 后 一 个 问题 ， 如 果 偏 移 是 表 大 小 
的 倍数 会 怎样 ? 例如 ， 假 设 要 将 键 为 736 的 条 目 添加 进 图 13-13 的 表 中 ， 有 : 

736%19=14 

736/19=38 


因为 单元 14 已 被 占用 了 ， 所 以 下 一 个 尝试 的 单元 是 (14+38) %19， 得 到 的 还 是 14! 为 了 
避免 陷 人 这 种 僵局 ， 只 要 key/length 是 length 的 倍数 就 使 用 1 作为 偏 移 量 。 这 是 一 个 很 罕见 的 现 
R: 平均 每 m 个 键 中 才 发 生 一 次 ， 其 中 m=length。 习 题 13.8 证 明了 如 果 使 用 这 个 冲突 处 理 程 序 
并 且 表 的 大 小 是 一 个 素数 ， 那 么 任何 键 的 偏 移 序列 将 会 覆盖 整个 表 。 

下 面 对 !- 偏 移 版 本 稍 做 改进 ， 得 到 双 散 列 的 insert 方 法 : 


pair<iterator, bool> insert (const value_type<const key_type, T>& x) 
{ 


key_type key = x.first: 
unsigned long hash int = hash (key); 
int index = hash, int % length, 
offset — hash int / length; 
if (offset % length == 0) 
offset = 1; 
while ((buckets [index]. marked_for_removal)!| 
buckets [index].occupied && key !— buckets [index].first) 
index = (index + offset) % length; 
if (buckets [index].occupied && key == buckets [index]. first) 
return pair <iterator, bool> (find (key), false) 
buckets [index] first = x.first: 
buckets [index].second = x.second: 
buckets [index].occupied = true: 
buckets [index].marked for removal = false; 
count ^ +; 
count plus- +; 


check for expansion( ); 
return pair<iterator, bool> (find (key), true); 
) // insert 


check_for_expansion 方 法 结合 考虑 了 商 - 偏 移 和 对 素数 大 小 的 表 的 需要 : 


void check_for_expansion( ) 
{ 
unsigned long hash_int: 
int index, 
offset, 
old_length; 


If (count. plus > int (MAX, RATIO * length) 
{ 


value_type<key type, T> * temp buckets = buckets; 
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old length — length; 
length = next prime (old length); 
buckets = new value type«key type, T> [length]; 
for (int i = 0; i « old length; i+ +) 
if (temp buckets [i].occupied) 
{ 
hash int = hash (temp_buckets [i].first); 
index = hash int % length; 
offset — hash int / length; 
if (offset % length == O) 
offset = 1; 
while (buckets [index].occupied) 
index = (index + offset) % length; 
buckets [index] = temp_buckets [i]; 
) // 将 temp_bucketsfi] 送 回 桶 中 
delete[ ] temp_buckets; 
count plus = count; 
) / 桶 大 小 加 倍 
} / 方法 check_for_expansion 


next_prime 方 法 返回 至 少 是 变 元 两 倍 的 最 小 素数 。 


// 后 置 条 件 : 返回 至 少 是 p 的 两 倍 的 最 小 的 素数 。 
int next_prime (int p) { 


int i: 


bool factorFound; 


p=2*p+1; 
while (true) 
{ 

i= 3; 


factorFound = false: 


// 检测 3,5,7,9,.…,sqrt(p) 是 否 是 p 的 因子 
while (i * i < p && !factorFound) 
if (p %i == 0) 
factorFound = true; 
eise 
| += 2; 
if (!factorFound) 
return p; 
p += 2;/ 获取 下 一 个 备 选 素数 
) // 当 没 有 找到 素数 时 
) / 方法 next_prime 


对 1- 偏 移 版 本 的 find 方 法 所 做 的 惟一 改动 是 通过 hash(keyyylength 计 算 偏 移 ， 并 且 在 while 
循环 中 ，index 是 和 偏 移 量 而 不 是 1 相 加 : 


iterator find (const key_type& key) 


_BRIHAR s 939- 


unsigned long hash. int = hash (key); 
int index = hash int % length, 553 
offset — hash int / length; 
if (offset % length == 0) 
offset — 1; 
iterator itr; 
while (buckets [index].marked for removal 
|| (buckets [index].occupied 
&& buckets [index].first ! — key)) 
index = (index + offset) % length; 
if (buckets [index].occupied && !buckets [index].marked for removal) 
return end( ); 
itr.buckets = buckets; 
itr.index = index; 
itr.length = length; 
return itr; 
) // find 


13.5.4 节 说 明了 使 用 商 偏 移 和 素数 大 小 的 表 的 开放 寻 址 方式 所 表现 出 的 预期 性 能 。 如 果 采 


用 均 义 散 列 设想 ， 那 么 插入 、 删 除 和 查找 的 平均 时 间 花 费 都 是 常数 。 
13.5.4 开放 地 址 散 列 分 析 


现在 信 算 使 用 开放 地 址 散 列 方式 调用 find 方 法 的 成 功 和 失败 查找 的 时 间 。 特 别 是 ， 假 设 使 
用 商 偏 移 ， 表 的 大 小 是 素数 ， 并 且 满 足 均匀 散 列 设 想 。 
正如 在 链 式 散 列 分 析 中 所 做 的 ， 还 是 使 用 m 作 为 length 的 值 ，n 作 为 count 的 值 。 采 用 循环 
途 代 次 数 作为 成 功 和 失败 查找 的 平均 和 最 坏 时 间 花 费 的 估算 。 当 表 中 已 经 有 上 > 0 个 值 时 ， 失 
败 查 找 需 要 的 迭代 次 数 恰 好 和 插入 第 (k+1) 个 值 需要 的 迭代 次 数 相同 。 并 且 这 也 正 是 成 功 查找 
第 (k+1) 个 值 所 需要 的 迭代 次 数 。 
对 任何 满足 0 < k<m 的 任意 tk， 定义 

E(k,m) 
为 插入 第 (k+1) 个 值 时 所 需要 的 预期 欠 代 次 数 。 
根据 刚才 提出 的 第 (+ 了) 个 值 的 插入 和 第 x 个 值 的 失败 查找 之 间 的 关系 ，find 方 法 应 满足 下 


RS fe: 





averageTime,(n,m) = E(n,m) 次 迭代 

因此 我 们 将 计算 E(n,m) 来 估算 find 方 法 的 averageTime,(n,m)。 无 疑 ， 
E(0,m1 ”对 任意 的 m>1 

对 任意 k>0， 如 果 第 (k+1) 个 值 最 初 散 列 到 一 个 开放 地 址 ， 那么 E(k,m)=1; APE DBI is 
T8, xXx JL JEn K/m. Bill, HEIL km, 第 (k+1) 个 值 最 初 将 散 列 到 一 个 已 占用 的 地 址 ， 
因此 需要 的 迭代 次 数 是 1 加 上 表 的 其 余部 分 所 需要 的 迭 代 次 数 。 但 是 在 表 的 其 余部 分 所 需要 的 
还 代 次 数 恰好 是 在 大 小 为 m- 1 的 表 中 插入 第 x 个 值 需要 的 迭代 次 数 ， 即 E(k 1,m- 1). 
将 上 述 最 后 一 段 论述 编写 成 一 个 等 式 ， 得 到 


nA 
mil 
A 
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E(k,m) — ksi (14 E(k - 1m 1) 其 中 1 <k<m 
m m 





把 这 个 弟 推 关系 和 初始 条 件 ( 即 对 任意 m > 1，E(0,m)=1) 相 结 合 ， 可 以 得 到 尔 数 E 的 递归 
定义 。 化 简 递 推 关 系 ， 得 到 


E(k,m) = 14 E(k-1,m-1) 其 中 1 <k<m 
m 


在 例 A1.6 中 ， 开 发 了 这 个 等 式 的 闭合 形式 ; 也 就 是 说 ， 结 果 的 计算 既 不 需要 循环 ( 像 求 

Al) 也 不 需要 递归 调用 。 结 果 是 : 
E(k,m)=(m+1)/(m+1-k) 所 有 满足 0 < K< 严 的 mm 和 大 
这 个 猜想 可 以 用 数学 归纳 法 证 明 ( 对 X 或 六 进行 归纳 )。 
现在 再 将 它 和 find 方 法 的 averageTimeu(n,m) 联 系 起 来 : 
averageTime,(n m)-E(n,m)-(m* 1)/(me-1—n) 
= 1/(1-n/m) 

R) FHI LIERE fh fEaverageTime;(n,m). IEMA Fd d rn dl A n4 AH RABE E 

E(O,m)+ E(1,m) +--+ E(n—1,m) 


n 
] m-l m+l m+l m-4i 
= + + Ted 


averageTime;, (n,m) = 





nml m m-1 ) m—-n+2 
mt 1 l 1 1 
= -一 一 | 一 一 + 一 + 一 -一 十 … 十 

n 


m+l m m-l m—n+2 
一 个 重要 的 自然 对 数 的 基于 微 积 分 的 属性 是 : | 

YU j= ink 对 应 1 的 任意 整数 
当 k 越 大 ， 这 个 近似 值 就 越 准 确 。 邦 么 


] 1 1 1 m+l m-n+l 
— ob — tet = 9 ljo »l/jseln(m-clD)-In(m-n41 
m+l m m-i m~n+2 2 J 2, J ( ) ( ) 


对 find 方 法 ， 现 在 可 以 推断 


m-41 





averageTime (n,m) = (In(m +1)—In(m — n 4 1)) 


n 


m+1 m-i m l 
= nf )-2u 
n m—-n+l n l—n/m 


这 些 信 算 的 意义 在 于 说 明了 成 功 和 失败 查找 的 时 间 花 费 只 依赖 于 n/m 的 比值 。 例 如 ， 如 果 
n/m 是 0.5， 











averageTime. (n,m) = TE — 3 -2]1n2 «1.39 3X (X 


averageTime, (n,m) = f / (1 一 3) =2 次 迭代 
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图 13-14 总 结 了 成 功 和 失败 查找 (也 就 是 find 方 法 调用 ) 的 时 间 花 费 估算 。 为 了 进行 比较 ， 
这 里 还 包括 了 图 13-5 中 有 关 链 式 散 列 的 信息 。 图 13-15 提 供 了 一 些 细节 : 各 种 4 和 m 的 比值 所 对 
应 的 预期 循环 迭代 次 数 。 为 了 进行 比较 也 包括 了 图 13-6 中 有 关 链 式 散 列 的 信息 。 

粗略 地 观察 图 13-15， 感 党 上 链 式 散 列 比 双 散 列 快 很 多 。 不 过 图 中 给 出 的 只 是 循环 迭代 次 
数 估算 。 运 行 时 间 测 试 则 可 能 是 (也 可 能 不 是 ) 另 一 种 的 情形 。 运 行 时 间 比 较 是 编程 项 目 
13.1 的 主题 。 


SEX: 
averageTime,(n, m) = Am aK KR 


averageTime,(n, m) = A TRIER 
AHYI: 
average Time,(n, m) = a In ( (0A 


] 
averageTime, (n, m) = 





图 13-14 链 式 和 双 散 列 下 ， 调 用 find 进 行 成 功 和 失败 查找 的 平均 时 间 估 算 。 
图 中 ，n= 插 入 值 的 数量 ，m= 表 的 长 度 = 桶 的 数量 


链 式 散 列 : 
成 功 0.13 0.25 038 0.45 0.50 


失败 0.25 050 0.75 0.90 0.99 


1.14 1.39 1.85 2.56 4.65 
1.33 2.00 4.00 10,00 100.00 





图 13-15 链 式 散 列 和 双 散 列 下 ， 调 用 find 进 行 成 功 和 失败 查找 的 平均 循环 迭代 次 数 估算 。 
图 中 ，*= 插 入 值 的 数量 ; m= 表 的 长 度 = 桶 的 数量 


即使 均匀 散 列 设想 适用 ， 在 最 坏 情况 下 ， 仍 旧 能 将 每 个 值 散 列 到 相同 的 索引 上 并 产生 相 
同 的 偏 移 量 。 因 此 双 散 列 下 的 find 方 法 的 worstTimes(n,m) 和 worstTimeu(n,m) 都 和 nn 成 线性 关系 。 
链 式 散 列 和 双 散 列 的 所 有 相关 文件 可 以 参阅 本 书 网 站 的 源 代码 链接 。 


总 结 


本 章 中 开发 了 hash_map 类 ， 它 在 平均 情况 下 的 插入 、 查 找 和 删除 只 花费 常数 时 间 。 这 个 
异常 的 性 能 是 由 于 散 列 ( 即 把 键 转换 到 表 索 引 的 过 程 )。 散 列 算法 必须 包括 一 个 冲突 处 理 程序 ， 
以 处 理 两 个 键 可 能 散 列 到 相同 的 索引 上 的 情形 。 一 个 广泛 应 用 的 冲突 处 理 程序 是 链 式 的 。 在 
链 式 方法 中 ，hash_map 容 器 被 表示 成 一 个 列表 的 数组 。 每 个 列表 包含 了 散 列 到 数组 中 该 索引 
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上 的 键 所 对 应 的 项 。 另 一 种 冲 罕 处 理 程序 是 开放 寻 址 : 当 键 散 列 到 的 索引 所 对 应 的 表单 元 包 
STA 个 键 的 项 时 ， 就 查找 表 的 剩余 部 分 ， 直 到 找到 一 个 未 占用 单元 或 是 匹配 的 键 。 

均匀 散 列 设想 指 的 是 任意 键 都 是 以 同等 几率 散 列 到 表 的 任意 索引 的 情况 。 关 于 链 式 散 列 ， 
均匀 散 列 设想 瞳 示 着 表 中 每 个 列表 的 平均 大 小 都 小 于 某 些 常数 。 而 关于 开放 地 址 散 列 ， 这 一 
设想 暗示 着 表 中 项 和 表 的 长 度 的 比值 被 限定 在 某 些 常数 之 上 。 

加 载 因 子 是 表 中 项 的 数量 和 表 大 小 的 比值 。 如 果 均 匀 散 列 设想 成 立 ， 那 么 成 功 和 失败 查 
找 的 时 间 花 费 只 依赖 于 加 载 因 子 。 这 对 于 播 和 人 和 删除 也 同样 成 立 。 只 要 加 载 因 子 达到 某 些 固 
定 比值 ， 表 的 大 小 就 加 倍 ， 那 么 插入 、 删 除 或 查找 的 平均 时 间 花 费 是 常数 。 


习题 


13.1 用 Moo 大 学 中 25 000 个 学 生来 构造 一 个 hash_map 容 器 。 每 个 学 生 的 键 是 学 生 的 惟一 
J 六 位 ID 号 码 。 学 生 对 中 的 第 二 个 组 件 是 学 生 的 年 级 平均 成 绩 。 在 hash_map 容 器 中 
插入 几 个 项 。 | | 

13.2 用 Moo 大 学 中 25 000 个 学 生来 构造 一 个 hash_map 容 器 。 每 个 学 生 的 键 是 学 生 的 惟一 
的 六 位 ID 号 码 。 学 生 对 中 的 第 二 个 组 件 是 学 生 的 年 级 平均 成 绩 和 在 班 上 的 名 次 。 在 
hash_map 容 器 中 插入 儿 个 值 。 注 意 第 二 个 组 件 不 是 由 单个 数据 组 成 的 。 

13.3 假设 己 有 一 个 hash_map 容 器 ， 希 望 插入 一 个 项 (除非 它 已 经 在 容器 中 了 )。 如 何 实现 ? 

13.4 作为 一 名 使 用 hash_map 类 的 编程 者 ， FA —*F print. sorted EA: 

MRR: 键 的 类 中 包含 运算 符 <。 

/后 置 条 件 : 按照 键 的 升序 输出 从 first (包括 在 内 ) 到 last (不 包括 在 内 ) 
i 之 间 的 项 。 

template<class Forwarditerator> 

void print sorted(Forwardlterator first, Forwarditerator last); 


提示 ”基本 思想 是 将 散 列 映射 拷贝 到 一 个 映射 中 ， 然 后 输出 上 映射 。 但 是 为 了 构造 一 个 
映射 对 象 ， 定 义 中 必须 包括 前 两 个 模板 变 元 (前 置 条 件 使 得 函数 类 less 成 为 缺 省 的 第 
三 个 模板 变 元 )。 在 第 12 章 的 tree_sort 方 法 定义 之 前 已 经 看 到 了 这 个 状况 。 为 了 确定 
映射 定义 的 模板 变 元 ，print_sorted 调 用 
' print. sorted. aux(first,last,(*first).first,(*first).second); 
print_sorted_aux 定 义 的 开头 是 : 
| template <class Forwarditerator, class Key, class T> 


. void print sorted aux (Forwardlterator first, Forwardlterator last, Key, T) 


map-« Key, T> my map; 


13.5 H PRE 7) SEHE ER LE FUA, 使 得 averageTime(m) 是 OKe)， worst-Time(n)## O(h), 
”并 且 这 些 都 是 最 小 上 界 。 菜 些 方 法 的 g 和 有 h 可 能 是 相同 的 。 | 
a. 成 功 调用 【也 就 是 找到 项 ) 通用 型 算法 find 查 找 顺 序 容 器 (如 数组 、 向 量 、 双 端 
队列 或 列表 ) 中 的 项 。 | 
— b. 调用 通用 型 算法 binary_search; 假设 容器 中 的 项 是 按 顺 序 排列 的 ， 并 且 容 器 支持 
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随机 访问 迄 代 器 。 
c. 成 功 凋 用 BinSearchTree 类 中 的 find 方 法 。 
d. 成 功 调用 map 类 中 的 find 方 法 。 
e. 成 功 调用 hash_map 类 中 的 find 方 法 一 一 应 当 采 用 均匀 散 列 设想 。 

13.6 在 链 式 散 列 的 实现 中 ， 为 什么 使 用 数组 取代 了 回 量 ? 

13.7 使 用 本 章 中 讨论 的 开放 地 址 策略 ， 只 要 count_plus 的 值 达到 国 值 就 重新 散 列 并 将 表 大 
小 加 倍 ， 尽 管 count 的 值 可 能 远 远 低 于 国 值 。 假 设 用 如 下 行为 所 代 上 述 做 法 : 只 要 
count 的 值 达到 滴 值 就 重新 散 列 并 将 表 大 小 加 倍 ， 而 当 count_plus 达 到 国 值 时 就 重新 
散 列 并 且 不 会 将 表 大 小 加 倍 。 在 什么 情形 下 这 种 “改进 ”是 低 效 率 的 ? 


提示 ”如果 count 的 值 接近 count_plus 值 会 怎样 ? 


13.8 假设 p 是 一 个 素数 。 使 用 模 代 数 证 明 ， 对 任意 正事 数 jndex 和 offei (offsel 不 是 PP 的 僧 
数 )， 下 面 的 容器 恰好 有 p 个 元 素 : 
(index + k*offset)%p 其 中 k=0,1,2,...p-—1 
13.9 给 定 下 面 的 程序 段 ， 添 加 代码 输出 所 有 的 键 ， 然 后 添加 代码 输出 所 有 的 值 : 


hash_map<string, int, hash_func>age_map; 


age_map.insert (value_type<const string, int> ("dog", 15)); 
age_map.insert (value_type<const string, int ("cat", 20)); 
age map.insert (value_type<const string, int> ("turtle", 15)); 
age map.insert (value. type «const string, int> ("human", 15)); 


13.10 EE Se BELL ROI FNE FE ES (o PS B] FP c HE Pl EJ zs el cK s (TREE Entf 4 HAT 
字 节 ，boeol 值 占用 1 个 字 节 。 特 别 是 ， 假 定 table. length= 100003, ，loadFactor 是 0.75， 
H.countzcount, plus-75000, 

13.11 在 第 10 章 中 提 到 过 术语 字典 ， 可 以 把 它 看 作 一 个 任意 的 键 - 值 对 集合 ， 它 是 映射 的 
同义词 。 如 霖 要 创建 一 个 真正 的 字典 ， 那 么 你 是 更 喜欢 将 元 素 存 储 在 一 个 map 容 器 
还 是 一 个 hash_map 容 器 中 ? 

13.12 使 用 采用 商 偏 移 冲 突 处 理 程序 的 开放 寻 址 方法 ， 将 下 列 键 插入 一 个 大 小 为 13 的 表 
中 : 

20 
33 
49 
22 
26 . 


下 面 是 相关 的 余数 和 商 : 











IGF 


键 键 %13 键 /13 
20 7 i 
33 7 2 
49 10 3 
22 9 l 
26 0 2 
202 7 15 
508 1 39 
38 12 2 
560 9 9 0 





编程 项 目 13.1: 使 用 链 式 和 双 散 列 构造 一 个 符号 表 的 运行 时 间 比 较 


进行 运行 时 间 实 验 ， 比 较 链 式 散 列 、 使 用 1- 偏 移 的 开放 寻 址 和 使 用 商 偏 移 的 开放 寻 址 。 
人 在 每 种 情况 中 ， 使 用 0.75 作 为 最 大 加 载 因子 并 采用 素数 表 大 小 (next_prime 方 法 可 以 生成 一 个 
足够 大 的 素数 来 避免 表 的 重新 散 列 ) hash mapl.h ( 链 式 )、hash_map2.h (1- 偏 移 ) 和 
hash_map3.h (Aiatz) 文件 可 以 参阅 本 书 网 站 的 源 代 码 链接 。 
实验 将 模拟 编译 器 的 一 部 分 ， 有 具体 说 是 将 标识 符 散 列 到 一 个 符号 表 中 。 符 号 表 曾 经 在 第 7 
章 的 中 绥 转 换 成 后 缀 的 应 用 中 讨论 过 ， 并 在 实验 17 里 实现 了 它 。 为 了 简化 ， 每 个 元 素 的 值 部 
分 将 采用 空 字 符 串 。 











种 14 章 图 、 树 和 网 络 


很 多 情况 下 ， 和 人们 往往 希望 研究 对 象 之 间 的 关系 。 例 如 ， 在 一 个 课程 表 中 ， 对 象 是 课程 ， 
关系 就 基于 是 否 必修 这 一 先决 条 件 。 在 航空 旅行 中 ， 对 象 是 城市 ; 如 果 两 个 城市 间 有 班机 ， 
那么 它 们 就 十 相关 的 。 从 视觉 的 角度 要 求 用 图 的 形式 描述 这 样 的 情形 ， 使 用 点 ( 称 作 顶 点 ) 
代表 对 象 ， 而 线 ( 称 作 边 ) 代表 关系 。 本 章 将 介绍 几 个 基于 顶点 和 边 的 容器 。 最 后 将 在 一 个 
类 中 定义 、 设 计 并 实现 其 中 一 种 容器 ， 其 他 的 结构 可 以 定义 为 这 个 类 的 子 类 。 类 和 子 类 目前 
郡 不 是 标准 模板 库 的 一 部 分 。 


目标 


1) 定义 有 向 容器 和 无 向 容器 情况 下 的 术语 图 、 树 和 网 络 。 

2) 比较 广度 优先 迭代 和 深度 优先 迭代 。 

3) 理解 Prim 的 查找 最 小 生成 树 的 贪心 算法 以 及 Dijkstra 的 查找 顶点 间 最 短路 径 的 贪心 算法 。 
4) 在 network 类 中 ， 比 较 邻 接 表 设 计 和 邻接 矩阵 设计 。 

5) 能 够 解决 包括 回溯 通过 图 、 树 或 网 络 情形 的 问题 。 





14.1 无 向 图 


无 向 图 由 顶点 和 称 作 边 的 无 序 顶 点 对 组 成 。 

无 向 图 由 称 作 顶点 的 项 和 不 同 的 称 作 边 的 无 序 顶 点 对 组 成 。 下 面 是 一 个 无 向 图 
TAS: A, B, C, D, E 

边 : (A,B), (A,C), (B,D), (C,D), (C,E) 


边 中 的 顶 后 对 被 封闭 在 圆 括号 里 ， 代 表 顶 点 对 是 无 序 的 。 例 如 ， 称 从 A 到 B 有 一 条 边 和 从 
3 到 4 有 一 条 边 是 完全 相同 的 。 这 也 是 之 所 以 使 用 “无 向 ”这 个 词 的 原因 。 图 14-1 描 给 了 这 个 
无 问 图 ， 其 中 每 条 边 用 连接 它 的 顶点 对 的 线 表示 。 

根据 图 14-1 可 以 得 到 作为 顶点 和 边 的 容器 的 无 向 图 的 原始 公式 。 而 且 ， 图 14-1 比 原始 公式 
更 好 地 领会 了 无 向 图 。 因 此 从 现在 开始 将 用 如 图 14-1 所 示 的 形式 代替 公式 进行 盖 述 。 

图 14-2 包 含 了 另外 几 个 无 向 图 。 注 意 边 的 数量 可 以 小 于 顶点 的 数量 (如 图 14-2a 和 b 所 示 )、 
等 于 顶点 的 数量 (如 图 14-1 所 示 ) 或 大 于 顶点 的 数量 (如 图 14-2c 所 示 )。 

如 采 一 个 无 向 图 包含 了 所 有 可 能 的 边 ， 就 称 它 是 完全 的 。 在 一 个 完全 无 向 图 中 ,， 边 的 数 
量 是 多 少 呢 ? 令 m 代 表 顶 点 数量 。 图 14-3 显 示 了 当 m=6 时 边 的 最 大 数量 是 15。 

能 不 能 求 出 一 个 公式 来 计算 4 个 顶点 的 完全 无 向 图 中 边 的 数量 昵 (nn 是 任意 正 整 数 ) 0 
般 而 言 ， 从 n 个 顶点 中 的 任意 一 个 开始 ， 并 和 其 余 n-1 个 顶点 各 构造 一 条 边 。 然 后 从 这 A-1 个 顶 
上 乓 中 任意 一 个 开始 ， 和 其 余 n-2 个 顶点 各 构造 一 条 边 (到 第 一 个 顶点 的 边 在 前 一 步 中 已 经 构造 
了 )。 表 从 这 n-2 个 顶点 中 任意 一 个 开始 ， 和 其 余 n-3 个 顶点 各 构造 一 条 边 。 持 续 这 个 过 程 ， 吉 
到 在 第 n-1 步 中 构造 最 后 一 条 边 。 构 造 的 边 的 总 数 是 : 
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图 14-1 无 加 图 的 可 视 表 示 
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Screenwriter Director Actors Charlotte 
Leads Supporting Atl / 
a) 
B E 
Tallahassee 
A C F G H 
Miami 
b) 
D . 

c) 

图 14-2 a) 有 6 个 顶点 和 5 条 边 的 无 向 图 。b) 有 8 个 顶点 和 7 条 边 的 无 向 图 。 

c) 有 8 个 顶点 和 11 条 边 的 无 向 图 
Se 
C A. 
E~- F 


图 14-3 6 个 顶点 且 具 有 最 大 数量 (15) 的 边 的 无 向 图 
(n—1)+(n—2)+(n—-3)+---+241= S iznn-0/2 


这 最 终 的 等 式 可 以 通过 直接 归纳 n 进 行 证 明 ， 也 可 以 从 例 A1.1 中 的 证 明 得 来 -前 4 个 正 
整数 的 总 和 等 于 n(n+1)/2。 
如 果 在 两 个 顶点 之 间 有 一 条 边 ， 那 么 它们 就 是 邻接 的 。 例 如 ， 在 图 14-2b 中 ，Charlotte 和 
Atlanta 是 邻接 的 ， 而 Atlanta 和 Raleigh 就 不 是 邻接 的 。 邻 接 的 顶点 称 作 邻 居 ， 
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是 一 个 顶点 序列 ， 其 中 每 对 连续 的 项 点 部 是 一 条 边 。 
是 一 个 顶点 序列 ， 其 中 每 对 连续 的 顶点 都 是 一 条 边 。 例 如 ， 在 图 14-2c 中 ， 

A, B, E, H 

EMAR HRR, DIA(AJB). (GLEYRICEH)REXA. 5 — RA ASUHBUERS EE: 

A, C. F, D, G, H 

对 K 个 顶点 的 路 径 而 言 ， 路 径 的 长 度 是 上 -1。 换 名 话说 ， 路 径 长 度 是 路 径 上 边 的 数量 。 例 
如 ， 在 图 14-2c 中 ， 从 C 到 4 的 路 径 长 度 是 3: 


路 径 
路 径 


C, F, D, A 
事实 上 还 有 一 条 更 短 的 从 C 到 A 的 路 径 ， 即 ， 

C, A 

一 般 来 说 ， 在 两 个 顶点 之 间 可 能 有 几 条 最 短路 径 。 例 如 图 14-2c 中 ， 
A, B, E 

和 

A, C, E 

都 是 从 4 到 无 的 最 短路 径 。 


回路 是 一 条 路 径 ， 它 的 第 一 个 和 最 后 一 个 顶点 是 相同 的 并 且 没有 重复 的 边 。 例 如 在 图 14-2b 中 ， 

Atlanta, Tallahassee, Miami, Atlanta 

是 一 条 回路 。 在 图 14-2c 中 ， 

B, E, C, A, B 

是 一 条 回路 。 同 样 ， 

E, C, A, B, E | 

也 是 一 条 回路 。 图 14-2a 中 的 无 向 图 是 无 环 的 ， 也 就 是 说 ， 它 不 含 任何 回路 。 在 该 无 向 图 中 ， 

Producer, Director, Producer 
不 是 一 个 回路 ， 因 为 边 (Producer, Director) 是 重复 的 一 无 向 图 中 的 边 是 无 序 对 。 

如 末 无 同 图 中 任 两 个 不 同 顶 点 间 都 有 一 条 路 径 ， 那 么 就 说 该 图 是 连通 的 。 非 正式 地 说 ， 
当 无 向 图 是 “一 整 块 ”时 就 是 连通 的 。 例 如 ， 图 14-1 到 14-3 中 所 有 的 图 都 是 连通 的 。 下 面 的 
无 向 图 包含 6 个 顶点 和 5 条 边 ， 它 不 是 连通 的 : 
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14.2 有 回力 
到 目前 为 止 还 没有 涉及 到 边 的 方向 。 如 果 能 够 从 顶点 Y 到 达 顶 点 多， 那么 就 假设 也 可 以 
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从 顶点 W 到 顶点 VY。 在 很 多 情况 下 ， 这 个 假设 可 能 是 不 现实 的 。 例 如 ， 假 设 边 代表 街道 ， 顶 
点 代表 十 字 路 口 。 如 果 连 接 顶 点 V 到 顶点 W 的 街道 是 一 条 从 V 到 W 的 路 ， 而 从 W 到 V 可 能 就 没 
A AHE. 

在 有 向 图 中 ， 每 条 边 都 是 顶点 的 有 序 对 。 

有 回 图 由 顶点 和 边 组 成 ， 其 中 边 是 顶点 的 有 序 对 。 例 如 ， 下 面 是 一 个 有 向 图 ， 它 的 边 用 
角 括 号 来 代表 有 序 对 : 

顶点 : A, T, V, W, Z 

i: <A,T>, <A,V>, <T,A>, «VA», <V W>, <W,Z>, «ZW», <Z,T> 

绘图 时 ， 这 些 边 用 箭头 表示 ， 箭 头 的 方向 从 有 序 对 的 第 一 个 顶点 指向 第 二 个 顶点 。 例 如 ， 
图 14-4 包 含 了 刚才 定义 的 有 向 图 。 

有 问 图 中 的 路 径 必 须 遵 循 箭头 的 方向 。 有 向 图 中 路 径 的 正式 定义 是 k 个 顶点 (kL) V, 
Vi,.…. ,，V_ 组 成 的 序列 ， 并 满足 <W, V>, «V, Vw «Vo, V, PEAR. Blane 
14-4 中 

A, V, W, Z 

是 从 A 到 2Z 的 路 径 ， 因 为 <4, V>, «V, W> 和 <W, Z> 都 是 有 向 图 中 的 边 。 但 是 

A, T, Z, W 

Nie RIE, AAMTEZE Aid. (EAL BPR ATE, XEES 14-473 B £E E P1 TI 
点 ， 从 第 一 个 顶点 到 第 二 个 顶点 间 都 有 一 条 路 径 。 


4— —.— 


cS 


| 
\ 


Z 


| wx 
图 14-4 一 个 有 向 图 


有 问 图 D 是 连通 的 是 指 对 任意 一 对 不 同 的 顶点 x 和 y， 从 x 到 y 都 有 一 条 路 径 。 图 14-4 是 一 个 
连通 有 加 图 ， 但 是 下 面 的 有 向 图 则 不 是 连通 的 ( 试 着 说 明 原 因 ): 

根据 这 些 例子 可 以 看 出 ， 实 际 上 可 以 用 “有 向 图 ”来 定义 术语 “无 向 图 ”: 无 向 图 是 这 样 
一 种 有 由 图 ， 其 中 任意 两 个 顶点 V 和 多， 如 果 从 VY 到 W 有 一 条 边 ， 那 么 从 W 到 VY 也 有 一 条 边 。 这 
个 观察 结果 将 在 开发 C++ 类 中 派 上 用 场 。 

在 14.3 和 14.4 节 中 将 看 到 图 的 特殊 形式 : 树 和 网 络 。 当 术语 “图 ”.“ 树 ”或 “网 络 ” 吉 接 
出 现时 ,“ 有 向” 是 一 个 隐 含 的 前 级 。 无 向 的 结构 将 明确 地 称 为 “无 向 图 ”"、“ 无 向 树 ” 或 “无 
向 网 络 ”。 


14.3 树 


无 向 树 是 一 个 连通 、 无 环 的 无 向 图 ， 其 中 一 项 被 指定 为 根 项 。 例如， 下 面 是 从 图 14-2a 得 
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到 的 无 向 树 ; “Producer” RM. 


Producer 
Screenwriter Director Actors 


Leads Supporting 


ERZEN T, AMS RE EEE A, MAS — SR T CE 
的 树 。 树 一 一 有 时 称 作 有 向 树 一 一 是 一 个 有 向 图 ， 它 或 者 为 空 ， 或 者 包含 一 个 称 作 根 项 的 项 ， 
它 具 有 以 下 特点 : 

1) 没有 边 进入 根 项 。 

2) 每 个 非 根 项 上 恰好 有 一 条 边 进 入 它 。 

3) 从 根 项 到 每 个 其 他 项 之 间 有 一 条 路 径 。 

例如 ， 图 14-5 表 明 ， 很 容易 就 可 以 把 图 14-2a 中 的 无 向 树 重 绘 成 有 问 树 : 通常 不 需 为 画 树 
中 的 篇 头 担忧 ， 因 为 方向 总 是 自 顶 向 下 的 〈 除 了 在 绘制 类 和 子 类 的 层次 结构 时 ) 。 

第 8 章 中 的 很 多 二 又 树 方面 的 术语 一 一 人像“ 子女 ”`、“ 树 上 时” 和“ 分支” 一 一 也 可 以 扩展 应 
用 到 任意 的 树 上 。 例 如 ， 图 14-5 中 的 树 有 四 个 树叶 ， 高 度 为 2。 但 是 “ 满 ” 的 概念 一 般 不 能 应 
用 到 树 上 ， 因 为 对 一 个 父亲 可 能 的 子女 数量 没有 限制 。 事 实 上 ， 不 能 只 是 将 二 叉 树 定义 成 每 
个 项 至 多 有 两 个 子女 的 树 。 为 什么 不 能 呢 ? 图 14-6 有 两 个 不 同 的 二 又 树 ， 而 它们 作为 树 是 等 
价 的 。 . | 

Producer 
LN 
LN. 
图 14-5 一 个 (有 向 ) 树 


/ N 


图 14-6 两 个 不 同 的 二 叉 树 ， 一 个 包含 了 空 的 右 子 树 ， 而 另 一 个 包含 了 空 的 左 子 树 
"TEASE RE LAT (Al) 树 ， 其 中 每 个 顶点 至 多 有 两 个 子女 ， 分 别 标记 为 “ 左 ” 
子女 和 “ 右 ” 子 女 。 树 使 得 我 们 可 以 研究 如 父亲 -子女 和 管理 者 -管理 对 象 这 样 的 层次 关系 。 
并 且 由 于 树 是 任意 的 ， 所 以 不 必 受 二 又 树 至 多 是 两 个 子女 的 限制 。 
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14.4 网 络 


网 络 (ATMA) 是 一 个 图 ， 它 的 每 条 边 都 有 一 个 相关 的 非 负 整数 ， 称 作 是 边 的 权 值 。 
网 络 可 以 是 有 向 的 或 无 向 的 。 

有 时 会 将 一 个 非 负 整数 和 图 (可 以 是 有 问 的 或 无 向 的 ) 中 的 每 条 边 相 关联 。 这 些 非 负 整 
数 称 作 权 值 ， 这 样 得 到 的 结构 称 作 网 络 或 带 权 图 。 例 如 ， 图 14-7 中 是 一 个 无 向 网 络 ， 其 中 每 
个 权 值 代表 图 14-2b 的 图 中 城市 间 的 距离 。 

(Ale) 网 络 的 价值 是 什么 ”也 就 是 说 为 什么 带 权 值 的 边 的 方向 是 有 意义 的 ”即使 能 够 沿 
着 一 条 边 的 两 个 方向 行进 ， 但 沿 着 某 一 方向 的 权 值 也 可 能 和 男 一 方向 的 权 值 不 同 。 例 如 ， 假 
设 权 值 代表 飞机 在 两 个 城市 则 飞行 的 时 间 。 由 于 主要 是 西风 ， 所 以 从 纽约 飞 往 洛 杉 矶 的 时 间 
通常 要 比 从 洛杉矶 飞 往 纽约 的 时 间 长 。 图 14-8 显 示 了 一 个 网 络 ， 其 中 从 顶点 D 到 顶点 F 的 边 的 
权 值 和 该 边 上 另 一 方向 的 权 值 不 同 。 


Louisville Washington 





Salisbury 





462 42] 
Raleigh 
Charlotte 165 


fn 


Atlanta 
277 
Tallahassee 
675 
Miami 


图 14-7 —P FCS, ERT oR TH. REAR BA A L h PR Ar Bic h Z PB d 


50 ^ D G 
F H 





图 14-8 8 个 顶点 和 11 条 边 的 网 络 


对 网 络 中 两 个 顶点 间 的 每 条 路 径 ， 可 以 计算 路 径 上 的 权 值 之 和 。 例 如 ， 在 图 14-8 中 ， 路 径 
A、C、D、E 的 总 权 值 是 10.0。 能 否 找 到 一 条 从 A 到 E 的 更 短 的 路 径 、 即 总 权 值 更 小 的 路 答 ? 


O ”这 和 图 形 意义 上 的 “更 短 ”( 也 就 是 路 径 上 边 的 数量 更 少 ) 的 含义 不 同 。 
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从 A 到 E 的 最 短路 径 是 4、B、D、E， 总 权 值 为 8.0。14.5.4 节 中 将 开发 一 个 算法 ， 以 此 寻找 网 络 
中 两 个 顶点 之 间 的 最 短路 径 ( 可 能 会 有 多 条 )。 

图 14-8 中 的 网 络 不 是 连通 的 ， 因 为 ， 比 如 从 8 到 C 就 没有 路 径 。 回 忆 一 下 ， 在 一 个 有 向 网 
络 中 的 路 径 必须 要 遵循 箭头 的 方向 。 

现在 已 经 了 解 了 如 何 定义 一 个 图 、 树 或 网 络 ， 接 着 将 概略 描述 一 些 著名 的 算法 。 这 些 算 
法 的 实现 将 在 14.7.4 节 到 14.7.6 节 中 开发 。 


14.5 图 算法 

两 个 常见 的 图 算法 是 广度 优先 过 代 和 深度 优先 选 代 。 

学 习 其 他 图 算法 的 先决 条 件 是 要 能 选 代 通过 一 个 图 ， 因 此 先 从 迭代 器 开始 考虑 。 我 们 将 
关注 两 种 类 型 的 选 代 器 : 广度 优先 和 深度 优先 。 这 些 术语 使 我 们 想起 在 第 8 章 中 曾经 学 习 过 二 
叉 树 的 广度 优先 和 深度 优先 (也 称 作 前 序 ) 遍历 。 


14.5.4 ERS 


AUR I8] PTC 16] Ra ee ALAS, ETL eee (有 向 的 或 无 向 的 )。 
首先 ， 可 以 只 是 迭代 通过 图 中 全 部 的 顶点 。 和 迭代 不 需要 遵循 什么 特别 的 顺序 。 例 如 ， 下 面 是 
友 代 通过 图 14-8 所 示 的 网 络 中 的 顶点 的 过 程 : 

A, B, D, F, G, C, E, H 


除了 和 迭代 通过 图 中 全 部 顶点 之 外 ， 有 时 还 要 关注 迭代 通过 从 给 定 顶点 可 达 的 所 有 顶点 的 
情况 。 例 如 ， 在 图 14-8 的 网 络 中 ， 可 能 想 迭 代 通 过 从 4 可 达 的 所 有 顶点 ， 也 就 是 位 于 从 4 开始 
的 路 径 上 的 所 有 顶点 。 比 如 其 中 一 个 迭代 是 : | 

A, B, C, D, E, F, H 


顶点 G 从 4 是 不 可 达 的 ， 因 此 G 将 不 在 任何 从 4 开始 的 选 代 中 。 | 

广度 优先 迭代 器 ”广度 优先 近代 器 和 第 8 章 中 的 广度 优先 遍历 相似 ， 先 访问 出 发 的 顶点 ， 
然后 是 出 发 点 尚未 到 过 的 邻居 ， 然 后 是 这 些 邻 居 的 尚未 到 达 过 的 邻居 ， 等 等 。 例 如 ， 假 设 下 
面 的 图 (图 14-2b) 中 所 有 顶点 是 按照 字母 顺序 输入 的 : 


Louisville Washington 





Salisbury 


Raleigh 
Charlotte 


Atlanta 


Tallahassee 


Miami 
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下 面 将 从 Atlanta 开 始 执 行 广 度 优先 迭代 ， 并 按照 字母 顺序 访问 邻居 。 因 此 开始 是 : 
Atlanta 

现在 可 以 到 达 Atlanta 的 邻居 。 当 按照 字母 顺序 访问 这 些 邻 居 时 ， 得 到: 

Charlotte, Miami, Tallahassee 


然后 按照 字母 顺 访 问 Charlotte 的 尚未 到 达 的 邻居 ， 再 按照 字母 顺序 访问 Miami 和 
Tallahassee 的 尚未 到 达 的 邻居 。Charlotte 的 第 一 个 邻 届 Atlanta 被 忽略 , 因为 它 已 经 被 访问 过 了 。 
Charlotte 的 三 个 尚未 到 达 过 的 邻居 是 : 

Louisville, Raleigh, Washington 


现在 已 经 访问 了 Charlotte 的 所 有 的 邻居 ， 和 再 前 进 到 下 一 个 城市 Miami。 访 问 Miami 疝 未 访 
问 过 的 邻居 (没有 )， 以 及 Tallahassee 的 (没有 )、Louisville 的 (没有 )、Raleigh 的 (没有) inj 
未 访问 过 的 邻居 ， 然 后 是 Washington 疝 未 访问 过 的 邻居 ， 它 们 是 : 

Salisbury 


现在 就 全 部 完成 了 ， 因 为 Salisbury 没 有 尚未 到 达 过 的 邻居 。 换 名 话说， 已 经 迭代 通过 了 
从 Atlanta 可 以 到 达 的 所 有 城市 ， 从 Atlanta 开 始 的 广度 优先 运 代 是 : 


Atlanta, Charlotte, Miami, Tallahassee, Louisville, Raleigh, Washington, Salisbury 
nk MA LouisvilleJF 423] EREE., ABZ SR TAY HB) No FEE AE A: 
Louisville, Charlotte, Atlanta, Raleigh, Washington, Miami, Tallahassee, Salisbury 


试 着 确定 从 Charlotte 开 始 的 广度 优先 遍历 中 的 城市 访问 顺序 。 

在 设计 breadth_first_iterator 类 之 前 先 来 做 一 些 准 备 工 作 。 需 要 了 解 已 经 到 达 过 的 顶点 。 因 
此 ， 将 这 些 到 达 过 的 顶点 存储 在 某 种 类 型 的 容器 中 。 明 确 地 说 是 想 按照 顺序 访问 当前 顶点 的 
邻居 ， 而 这 些 邻 让 最 初 是 被 储存 在 容 妖 里 的 。 由 于 要 按照 这 些 顶 点 添加 进 容器 的 顺序 从 容器 
中 删除 它们 ， 所 以 队列 是 一 个 合适 的 选择 。 并 且 还 希望 能 记 住 当前 顶点 。 

现在 可 以 为 breadth_first_iterator 开 发 一 个 高 级 算法 一 一 细 市 将 推迟 到 创建 像 network 这 样 
的 可 以 舱 入 breadth_first_iterator 类 的 类 时 再 进行 探讨 。 构 造 右 将 开始 顶 皮 插入 队列 ， 然 后 把 
所 有 顶点 都 标记 为 尚未 到 达 的 : 

breadth_first_iterator (start 山 点 ) 

{ 

对 网 络 中 的 每 个 顶点 : 

将 它 标记 为 尚未 到 达 的 。 
把 start 顶 点 标记 为 可 达 的 。 
vertex_queue.push(start); 

}/ 构 造 器 的 算法 

后 加 运算 符 operator++(int) 将 vertex_queue 中 前 面 的 顶点 取出 队列 ， 然 后 迭代 通过 该 顶 
点 的 邻居 。 每 个 疝 未 到 达 过 的 邻居 将 被 标记 成 可 达 ， 然 后 播 和 队列。 


breadth_first_iterator operator++(int) 
{ 
breadth first iterator temp=*this; 


current-vertex queue .front(); 
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vertex queue.pop(0); 
对 current 的 每 个 邻居 项 点 : 
如 果 该 顶点 是 尚未 到 达 的 
{ 


将 该 顶点 标记 为 可 达 的 ; 
将 该 顶点 播 入 vertex_queue 队 列 
yAf 
return temp; 
Mhz VT nt) 8333 E 


举例 说 明 广 度 优先 迭代 是 如 何 进行 的 ， 假设 通过 输入 图 14-9 所 示 的 边 和 权 值 序列 创建 -- 
个 网 络 ， 创 建 的 网 络 将 和 图 14-8 中 的 网 络 相同 : 


30 ^b 5 
ol |: 0 
F —————+H 
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B 
C 
E 
D 
E 
D 
E 
F 
D 
H 
H 





”图 14-9 生成 图 14-8 所 示 网 络 的 边 和 权 值 序列 


假定 处 理 从 4 开始 的 广 朗 优 先 选 代 ， 首 先 在 构造 器 中 将 4 插入 队列 。 第 一 次 调用 ++ 将 4 从 
队列 中 取出 ; dBB. C. ES ATA SI; 返回 位 于 4 的 breadth_first_iterator。 第 二 次 调用 ++ 将 8 从 
队列 中 取出 ， 把 D 插 入 队列 ， 并 返回 位 于 B8 的 breadth_first iterator。 图 14-10 显 示 了 从 4 开始 的 
广度 优先 迭代 生成 的 完整 队列 。 

注意 在 图 14-10 中 缺少 了 顶点 G。 这 是 因为 G 从 4 是 不 可 达 的 。 如 果 从 任何 其 他 顶点 开始 执 
行 广度 优先 迭代 ,访问 到 的 顶点 将 比 图 14-10 更 少 。 例 如 ， 从 顶点 8 开始 广度 优先 迭代 将 依次 
访问 

B, D, E, F, H 

广度 优先 迭代 器 特别 适用 于 树 的 选 代 。 开 始 顶点 是 根 ， 正 如 第 8 章 所 述 ， 这 种 选 代 器 将 逐 
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层 访问 顶点 : 根 ， 根 的 子女 ， 根 的 孙子 ， 等 等 。 


由 ++ 返 回 的 迭代 器 
vertex_queue 所 位 于 的 顶点 





图 14-10 从 4 开始 的 广度 优先 迭代 的 顶点 。 顶 点 按照 图 14-9 中 
输入 的 顺序 被 插入 队列 ， 然 后 从 队列 中 取出 


深度 优先 迭代 器 ” 另 一 种 专门 的 迭代 器 是 深度 优先 迭代 器 。 深 度 优先 迭代 器 是 第 8 章 的 前 
序 遍 历 的 推广 。 回 忆 在 第 8 章 里 ， 前 序 遍 历 的 算法 是 : 


preOrder(t) 
{ 


x 
/ /N 


m 在 前 序 遍历 中 项 的 访问 顺序 : 


A, B, D, G, 1, H, J, K, L, C, E, F 





K L 


图 14-11 一 个 二 又 树 以 及 前 序 遍 历 中 项 将 被 访问 的 顺序 








er LA 
if( 非 空 ) 
{ 
访问 ! 的 根 项 ; 
preOrder(leftTree(1)); 
preOrder(rightTree(t)); 
yf 
WAIT S Po 
为 了 帮助 大 家 回忆 前 序 遍 历 是 如 何 工 作 的 ， 图 14-11 显 示 了 一 个 二 又 树 和 它 的 项 的 前 序 过 
历 。 可 以 将 一 个 二 叉 树 的 前 序 遍 历 描述 如 下 : 从 根 的 左 侧 路 径 开 始 。 一 旦 到 达 该 路 径 的 末尾 ， 
算法 回 湖 到 一 个 有 尚未 到 达 的 右 子 女 的 项 。 然 后 从 该 右 子 女 开 始 下 一 条 左 侧 路 径 。 
图 的 深度 优先 从 代 要 稍微 复杂 些 ， 因 为 在 图 中 没有 “ 左 ” 和 “ 右 ” 的 概念 。 首 先 ， 将 第 
一 个 顶点 标记 为 可 达 的 ， 其 他 每 个 顶点 都 是 不 可 达 的 。 然 后 ， 只 要 还 有 疝 未 访问 的 可 术 顶 反 ， 
就 访问 最 近 可 达 的 未 访问 的 顶点 并 将 它 的 不 可 达 的 邻居 标记 为 可 达 的 。 
例如 ， 在 下 面 的 图 中 ， 从 Atlanta 开 始 执行 深度 优先 运 代 ， 假 设 这 些 顶 点 最 初 是 按照 字母 
顺序 输入 的 : 





Louisville Washington Salisbury 


Raleigh 
Charlotte 
Atlanta 
Tallahassee 
Miami 
首先 访问 开始 顶点 : 
Atlanta 


然后 将 Atlanta 的 邻居 Charlotte、Miami、Tallahassee 标 记 为 可 达 的 ， 然 后 访问 最 近 的 可 达 
顶点 ， 即 Tallahassee (而 不 是 Charlotte ) 。Tallahassee 没 有 尚未 到 达 的 邻居 ， 因 此 访问 下 一 个 
最 近 可 达 的 顶点 Miami。Miami 也 没有 尚未 到 达 的 邻居 ， 因 此 访问 Charlotte， 并 将 Charlotte 的 
不 可 达 的 邻居 Louisvitle、Raleigh、Washington 标 记 为 可 达 的 。 

访问 最 近 可 达 顶 点 Washington， 而 且 它 仅 有 的 不 可 达 邻 居 Salisbury 被 标记 为 可 达 和 的 。 现 在 
Salisbury 是 最 近 可 达 的 顶点 ， 因 此 访问 Salisbury。 最 后 访问 Raleigh， 接 着 是 Louisville 。 顶 点 
的 访问 次 序 如 下 : | 

Atlanta, Tallahassee, Miami, Charlotte, Washington, Salisbury, Raleigh, Louisville 


从 Charlotte 开 始 的 深度 优先 迭代 的 顶点 的 访问 顺序 是 : 
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576 Charlotte, Washington, Salisbury, Raleigh, Louisville, Atlanta, Tallahassee, Miami 


(EJ ERR CIRC, BAVA ER ERAS, EE i R AT REDE D 81411 - 
MERE Ae, PPR Te RT ARTA RE Ae eR s 
队列 进行 存储 。 除 此 之 外 ， YR PE R Se E PR RERI AEAEE NAFN) 度 亿 移 迁 代 器 的 基本 策略 是 一 致 
的 。 下 面 是 operator++(int) 的 高 级 算法 : 

depth_first_iterator operator++(int) 

{ 

depth_first_iterator temp=*this; 
current-vertex stack.top(); 
vertex stack.pop(); 
对 current 的 每 个 邻居 顶点 : 
如 采 该 顶点 还 不 是 可 达 的 
{ 
将 它 标记 为 可 达 的 ; 
把 该 顶点 推 人 vertex_stack 
Mir 
return temp; 

HIRR DOOR FB gae FFF ++ int) B GI 

正如 在 广度 优先 迭代 中 所 做 的 ， 假 设 根据 下 列 输入 按照 给 定 次 序 创建 一 个 网 络 : 

AB40 

AC2.0 

AE 15.0 

BD1.0 

BE 10.0 

CD50 

DE 3.0 

D F 0.0 

FD2.0 

FH4O 

G H 4.0 


创建 的 网 络 和 图 14-8 所 示 的 相同 : 
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图 14- 12 显 示 了 在 根据 图 14- -9 的 输入 生成 的 图 14- -8 所 示 的 网 络 中 进行 深度 优先 迭代 的 堆栈 
状态 序列 。 也 可 以 开发 深度 优先 达 代 的 回溯 版 本 。 回 漳 版 本 是 等 价 的， 但 是 可 能 会 利用 递归 





二 


替代 显 式 的 堆栈 。 


Vertex where 
Stack (top vertex iterator returned by 
is shown leftmost) ++ is positioned 





Ro eee Se 
图 14-12 从 A 可 达 的 顶点 的 深度 优先 迭代 。 假 设 顶 点 是 按照 图 14-9 的 顺序 输入 的 


14.5.2 连通 性 


14.1 节 中 定义 了 连通 的 无 向 图 是 指 图 中 任意 两 个 顶点 之 间 都 有 一 条 路 径 。 例 如 ， 下 面 就 是 
一 个 连通 无 同 图 : 





Louisville Washington Salisbury 


Raleigh 
Charlotte 


Atlanta 


Tallahassee 


Miami 

只 有 当 网 络 是 连通 的 时 候 ， 才 能 执行 广度 优先 或 深度 优先 欠 代 通过 网 络 (或 无 向 网 络 ) 
中 的 全 部 顶点 。 事 实 上 ， 可 以 借助 任意 两 个 顶点 之 间 的 迭代 来 测试 连通 性 。 假 设 itr 是 通过 网 
络 中 全 部 顶点 的 迭代 器 。 令 vertex 是 一 个 类 ， 项 点 是 其 中 的 项 。 对 每 个 itr++ 返 回 的 迭代 器 位 于 
的 顶 斥 Y 而 言 ， 令 b_itr 是 从 Vv 开始 的 一 个 广度 优先 迭代 器 。 进 行 检测 ， 确 保 从 v 可 达 的 顶点 数量 
(包含 v 自 身 ) 等 于 网 络 中 的 顶点 数量 。 

下 面 是 判断 网 络 连通 性 的 高 级 算法 : 

// 后 置 条 件 : 如 果 这 个 网 络 是 连通 的 就 返回 真 。 人 否则 ， 返 回 假 。 


bool is_connected() 
{ 
A> itr Fé SGP 93 AR AE 
// 对 每 个 顶点 Y， 考 察 从 v 可 达 的 顶点 数量 是 否 等 于 这 个 网 络 中 顶点 的 总 数量 。 
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for(itr= 网 络 的 起 点 ; itr!= 网 络 的 终点 ; itr++) 
{ 


vertex v=*itr; 
/计数 从 v 可 达 的 顶点 数量 。 
unsigned int count=0; 
breadth first iterator b itr; 
for(b itrzbreadth first begin(v);b itr!-breadth first. end(); 
b_itr++) 
count++; 
if(count« Bi £& X /|v) 
return false; 
}// 当 itr 役 有 停止 迭代 时 
return true; 


}Wis_connected 方 法 的 算法 

现在 还 不 能 估算 这 个 算法 的 时 间 和 空间 需求 ， 因 为 它 Efi Vct T 3 [2875 S SHIH. 

企 14.5.3 节 和 14.5.4 节 中 ， 概 略 描述 了 两 个 重要 的 网 络 算法 的 开发 。 每 个 算法 都 是 十 分 复 
杂 的 ， 它 们 都 是 根据 算法 的 发 明 人 (Prim, Dijkstra) 命名 的 。 


14.5.3 产生 最 小 生成 树 


假设 一 个 电缆 公司 要 连接 一 个 社区 中 的 许多 住宅 ， 假 定 在 房子 下 面 铺设 电缆 的 成 本 是 数 
百 美 园 ， 求 住宅 连接 到 电缆 系统 的 最 小 代价 。 这 可 以 作为 一 个 连通 无 向 网 络 问 题 来 处 理 ， 每 
个 权 值 代表 两 个 邻居 间 铺 设 电 缆 的 成 本 。 图 14-13 给 出 了 一 个 示范 设计 ， 某 些 门户 之 间 的 距离 
没有 给 出 ， 因 为 它们 代表 了 不 可 行 的 连接 (例如 越过 一 座 山 )。 


5.0 28.0 














图 !4-13 一 个 连通 无 向 网 络 ， 其 中 顶点 代表 住宅 ， 权 值 代表 
连接 两 个 住宅 的 成 本 (单位 是 百 美圆 ) 
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”图 14-14 图 14-13 中 无 向 网 络 的 一 个 生成 树 
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图 14-15 图 14-13 中 无 向 网 络 的 另 一 个 生成 树 


网 络 的 生成 树 由 所 有 的 顶点 和 一 些 边 以 及 它们 的 权 值 组 成 。 生 成 树 最 小 是 指 在 网 络 中 其 
他 的 生成 树 的 权 值 之 和 不 会 更 小 。 | 

在 一 个 连通 无 向 网 络 中 ， 生 成 树 是 由 网 络 所 有 顶点 和 一 些 边 (以 及 它们 的 权 值 ) 组 成 的 
树 。 例 如 ， 图 14-14 和 图 14-15 显 示 了 图 14-13 中 网 络 的 两 个 生成 树 。 为 了 简单 起 见 ， 将 顶点 4 
指定 为 每 个 树 的 根 。 

最 小 生成 树 是 指 该 树 的 所 有 权 值 之 和 不 大 于 其 他 生成 树 的 权 值 之 和 。 最 初 的 铺设 电缆 问 
题 吕 以 重申 为 在 一 个 连通 无 向 网 络 中 构造 最 小 生成 树 。 为 了 说 明 解 决 这 个 问题 的 困难 程度 ， 
现在 试 着 为 图 14-13 中 的 网 络 构造 一 个 最 小 生成 树 。 当 解决 有 1000 所 住宅 的 社区 问题 时 ,“ 扩 
E ”你 的 解决 方案 将 是 多 么 困难 ? 

Prim 的 算法 构造 了 一 个 最 小 生成 树 。 

构造 最 小 生成 树 的 算法 应 归功 于 R.C.Prim (1957)， 这 里 给 出 它 的 基本 策略 。 从 一 个 空 的 
树 T 以 及 在 网 络 中 选择 的 任意 顶点 v 开 始 。 将 v 添 加 进 T。 对 每 个 顶点 w，(v, w) 是 权 值 为 wweight 
的 边 ， 将 有 序 三 元 组 <v, w, wweight> 保 存在 一 个 容器 里 一 一 很 快 将 会 了 解 是 什么 样 的 容器 。 然 
后 循环 ， 直 到 T 中 包含 了 和 原始 网 络 相 同 数量 的 顶点 。 在 每 次 循环 迭代 中 ， 从 容器 中 删除 三 元 
组 <x, y, yweight>，yweight 是 容器 中 所 有 三 元 组 里 最 小 的 权 值 。 如 果 y 还 不 在 T 里 ， 就 将 y 和 边 
(x, 》) 添 加 进 T， THEBCR BIER ET HAC, z) 为 权 值 是 zweight 的 边 的 三 元 组 <y, z, zweight» fi. 
FERE. 

应 当 使 用 什么 样 的 容器 呢 ? 容器 应 按照 权 值 排序 ; 还 需要 能 向 容器 中 添加 一 个 项 一 一 即 一 
个 三 元 组 ， 以 及 从 容器 中 删除 权 值 最 小 的 三 元 组 。 优 先 队 列 将 快速 完成 这 些 任 务 : 通过 基于 
堆 的 实现 ，push 方 法 的 averageTime(n) 是 常数 ， pop 的 averageTime(n) 和 nn 成 对 数 关系 。 任何 时 
人 息 ， 权 值 最 小 的 三 元 组 都 将 位 于 优先 队列 的 顶部 。 

为 了 了 解 Prim 的 算法 的 工作 原理 ， 从 图 14-13 中 的 无 向 网 络 开始 ， 该 图 重复 如 下 : 
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最 初 ， 树 T 和 priority_queue 对 象 pq 都 为 空 。 选 取 4 (BAERE HEE A Ti), AR 
加 进 T， 然 后 将 形 如 <A, w, wweight> 的 每 个 三 元 组 添加 进 pq9， 其 中 (4, w) 是 权 值 为 wweighi 的 
边 。 图 14-16 显 示 了 T 的 内 容 和 此 时 的 pq。 为 了 更 易 读 ，pq 中 的 三 元 组 按照 权 值 的 升序 显示 ; 
严格 地 说 ， 我 们 能 确认 的 就 是 top 方 法 将 返回 权 值 最 小 的 三 元 组 ， 而 pop 方 法 将 从 pq 中 删除 该 
二 元 组 。 | 

当 最 小 权 值 的 三 元 组 <4, B,5.0> 从 pq 中 删除 时 , 顶点 8 和 边 (4,B) 以 及 它 的 权 值 被 添加 进 T， 
而 三 元 组 <8,E,3.0> 添 加 到 pq (的 顶部 )。 如 图 14-17 所 示 。 

在 下 一 次 迭代 中 ， 从 pg 里 删除 三 元 组 <B, E, 3.0>， 顶 点 E 和 边 (B, E) 添 加 进 T， 三 元 组 <E， 
C, 28.0> 被 添加 进 pq。 如 图 14-18 所 示 。 

在 下 一 次 迭代 中 ， 从 pq 里 删除 三 元 组 <4, D, 7.0>， 顶 点 D 和 和 边 (4, D) 以 及 它 的 权 值 被 添加 
进 T， 而 三 元 组 <D, ,8.0> 和 <D, G, 2.0> 则 被 添加 进 pq。 如 图 14-19 所 示 。 

在 下 一 次 迭代 中 ， 从 pq 里 删除 三 元 组 <D, G, 2.0>， 顶 点 G 和 边 (D, G) 以 及 它 的 权 值 被 添加 
进 T， 而 三 元 组 <G, ,4.0> 则 被 添加 进 pqg。 如 图 14-20 所 示 。 

在 下 一 次 和 迭代 中 ， 从 pq 里 删除 三 元 组 <G, F, 4.0>， 顶 点 FF 和 边 (G, 本 以 及 它 的 权 值 被 添加 
进 T， 而 三 元 组 <F, C, 20.0> 则 被 添加 进 pq。 如 图 14-21 所 示 。 | 


T pq 

A <A, B, 5.0> 
<A, D, 7.0» 
<A, C, 18.0» 


图 14-16 在 图 14-13 所 示 的 无 向 网 络 上 应 用 Prim 算 法 时 开始 时 的 T 和 pq 的 内 容 


T pq 


B 
«B, E, 3.0» 
JA «A, D, 7.0» 
«A, C, 18.0» 


A 





图 14-17 在 图 14-13 所 示 的 无 向 网 络 上 应 用 Prim 算 法 的 过 程 中 T 和 pq 的 内 容 


工 pq 


50 . <A, D, 7.0> 
<A, C, 18.0> 
«E, C, 28.0» 

Fe] 14-18 在 图 14-13 所 示 的 无 向 网 络 上 应 用 Prim 算 法 的 过 程 中 T 和 pq 的 内 容 


在 下 一 次 迭代 中 ， 从 pq 里 删除 三 元 组 <D, F, 8.0>。 但 是 没有 项 加 入 T 或 pq， 因 为 F 已 经 在 T 
中 了 ! 


在 下 一 次 迭代 中 ， 从 pq 里 删除 三 元 组 <4, C, 18.0> ， 顶 点 C 和 边 (4, C) 以 及 它 的 权 值 被 添加 








T, 没有 项 加 入 pq。 没 有 项 加 入 pg 的 原因 是 由 于 所 有 C 上 的 边 ， 即 (C, A). (C, DAC, F) x} 


中 的 第 二 项 都 已 经 在 T 中 了 。 如 图 14-22 所 示 。 即 使 pq 非 空 ， 也 已 经 完成 了 ， 因为 原始 网 络 中 


的 每 个 顶点 都 已 经 在 T 中 了 。 
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A «E, C, 28.0» 
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图 14-19 在 图 14-13 所 示 的 无 向 网 络 上 应 用 Prim 算 法 的 过 程 中 T 和 pq 的 内 容 





T pq 
B 30 _ 5 

<G, F, 4.0> 

JA <D, F, 8.0» 
<A, C, 18.0> 
À <E, C, 28.0> 

PN 
| D G 


2.0 
图 14-20 在 图 14-13 所 示 的 无 向 网 络 上 应 用 Prim 算 法 的 过 程 中 T 和 pq 的 内 容 


T pq 


5.0 <D, F, 8.0» 


«A, C, 18.0» 
A F 
| .\4.0 
A O Ñ 
| D 2.0 G 


<F, C, 20.0> 
<E, C, 28.0> 
”图 14-21 在 图 14-13 所 示 的 无 向 网 络 上 应 用 Prim 算 法 的 过 程 中 T 和 pq 的 内 容 
T 的 构造 方式 说 明了 T 是 一 个 生成 树 。 用 反 证 法 能 够 证 明 T 是 一 个 最 小 生成 树 。 假 设 T 不 是 
一 个 最 小 生成 树 。 在 某 些 和 迭代 中 ， 三 元 组 <x, y, yweight> 从 pq 中 删除 而 边 (x,y) 加 入 T， 但 是 在 T 
中 还 有 其 他 顶点 ， 它 的 边 (v, y) 的 权 值 小 于 边 (x, y) 的 权 值 。 可 以 用 图 形 方 式 证 明 : 
T 不 在 T 中 


注意 由 于 v 已 经 在 T 中 了 ， 所 以 以 <y, ?> 开头 的 三 元 组 必定 早 就 添加 进 pPg 了 。 但 是 边 (, y) 
的 权 值 不 能 小 于 边 (x, y) 的 权 值 ， 因 为 从 pq 中 删除 的 是 三 元 组 <x, y, yweight», ABU <v, y,?> 
开头 的 三 元 组 。 这 同 (v, y) 的 权 值 小 于 (x, y) 的 权 值 的 声明 矛盾 。 因 此 添加 进 边 (x, y) 的 T 必 定 仍 
BR). £14 75HREVT get minimum spanning tree77iX. | 


LA 





下 


462 $14% 


T pq 
<F, C, 20.0> 
5.0 | «E, C, 28.0» 
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图 14-22 在 图 14-13 所 示 的 无 向 网 络 上 应 用 Prim 算 法 的 最 后 一 次 迭代 后 T 和 pq 的 内 容 


Prim 5 12:26 25 — I ODORE BA (第 11 章 介绍 的 霍 夫 曼 编码 算法 也 是 一 个 贪心 算法 )。 
在 每 次 循环 迭代 中 ,做 了 局 部 最 优选 择 : 权 值 最 小 的 边 添加 进 T。 这 个 局 部 最 优 (也 就 是 贪心 ) 
选择 的 序列 得 到 了 整体 最 优 的 解答 : T 是 一 个 最 小 生成 树 。 

14.5.4 市 介绍 了 另 一 个 贪心 算法 。 习 题 14.6 和 实验 29 证 明了 贪心 并 非 总 是 成 功 的 。 


14.5.4 寻找 网 络 中 的 最 短路 径 


构造 最 小 生成 树 的 策略 和 下 面 的 寻找 网 络 (或 无 向 网 络 ) 中 顶点 v1 到 其 他 某 些 顶点 v2 间 
最 短路 径 的 策略 很 相似 。 这 里 的 “最 短 ” 意 味 着 总 权 值 最 小 。 这 两 个 算法 都 是 贪心 的 , 而且 
都 使 用 了 优先 队列 。Edsgar Dijkstra (1959) 开发 的 最 短路 径 算法 在 本 质 上 说 是 : 自 v1 开 始 ， 
并 当 v2 的 对 从 优先 队列 pq 中 删除 时 就 停止 的 广度 优先 迭代 。 每 个 对 由 顶点 w 和 思 今 为 止 从 v1 
到 w 的 最 短路 径 上 所 有 边 的 权 值 之 和 组 成 。 

给 定 网 络 中 的 两 个 顶点 ，Dijkstra 的 算法 构造 了 一 条 最 短路 径 ， 即 总 权 值 最 小 的 路 径 ， 

优先 队列 是 根据 最 小 总 权 值 排序 的 ,我 们 使 用 了 一 个 map 容 器 weight_sum 来 记录 总 的 权 值 ， 
其 中 的 每 个 键 都 是 一 个 顶点 w， 它 映射 到 迄今 为 止 从 v1 到 w 的 最 短路 径 上 所 有 边 的 权 值 总 和 。 
为 了 能 在 完成 时 重新 构造 最 短路 径 ， 这 里 还 有 另 一 个 map 容 器 predecessor， 它 的 每 个 键 是 一 个 
顶点 w， 而 其 映射 的 对 象 是 迄今 为 止 从 v1 到 w 的 最 短路 径 上 的 w 的 直接 前 任 。 

基本 上 ，weight_sum 记 录 了 和 思 今 为 止 从 v1 到 其 他 每 个 顶点 间 路 径 的 最 小 权 值 。 最 初 ，pgq 
由 和 v1 邻接 的 顶点 (以 及 它们 的 权 值 ) 组 成 。 每 次 迭代 中 都 贪心 地 选择 了 pq 中 的 “顶点 - 权 
值 ” 对 <from, weight>， 它 的 总 权 值 是 pq 中 所 有 顶点 - 权 值 对 中 最 小 的 。 如 果 from 有 一 个 邻居 
to, 3 ERTESVI, ... , from, to> 可 以 减 小 它 的 总 权 值 ， 那么 就 改变 to 的 路 径 和 最 小 权 值 ， 并 将 
to (IRE APTE 例如 ， 可 能 有 : 


from 


v1——— À to 


那么 从 v1 到 to 之 间 的 总 权 值 就 减 小 到 13 op «to, 13> 加 入 到 pq， 而 to 的 前 任 变 成 ffom。 如 


霖 在 V1 和 v2 之 间 有 路 径 的 话 ， 这 将 最 终 产生 它们 之 间 的 最 短路 径 。 
开始 时 ，weight_sum 为 每 个 顶点 关联 一 个 非常 大 的 总 权 值 (如 10 000.0)， 而 predecessor | 








为 每 个 顶点 关联 一 个 空 顶 点 。 然 后 由 迭代 通过 v1 的 邻居 来 求 精 这 些 初 始 化 。 对 每 个 邻居 w， 它 
的 边 (Y1, w) 的 权 值 是 weight，weight_sum 将 w 映 射 到 weight，predecessor 将 w 映 射 到 v1， 并 将 
顶点 - 权 值 对 <w, weight> 添 加 进 pq。 对 v1 自身 而 言 ，weight_sum 将 v1 映射 到 0.0，predecessor 
将 v1 上 映射 到 v1。 初 始 化 阶段 就 完成 了 。 

假设 想 查 找 图 14-8 的 网 络 中 从 A 到 E 的 最 短路 径 ， 图 形 重复 如 下 : 





E 
15.0 
10.0 
A 4.0 B 3.0 
2.0 o] 
C— aD G 
oo| 2.0 m 
Fo "H 


初始 化 的 结果 如 图 14-23 所 示 。 注 意 忽略 了 项 点 G， 因 为 G 从 4 是 不 可 达 的 。 

现在 开始 寻找 从 4 到 天 的 最 短路 径 (如 果 有 的 话 )。 我 们 将 一 直 循环 ， 直 到 找到 该 路 径 ， 或 
p94 为 空 。 图 14-23 中 所 示 的 初始 化 之 后 ， 这 个 外 部 循环 将 第 一 次 执行 ， 从 pg 中 删除 对 <C, 2.0> 
FER (ARTER) 通过 C 的 邻居 。 从 C 出 发 的 边 上 ， 惟 一 的 顶点 是 D， 并 且 该 边 的 权 值 是 5.0。 
这 个 权 值 加 上 2.0(C 的 权 值 之 和 ) 是 7.0， 小 于 D 的 总 权 值 。 因 此 在 weight_sum 中 ，D 的 权 值 总 
和 改 成 7.0。 图 14-24 显 示 了 weight_sum、predecessor 和 pq 的 结果 。 

图 14-24 指 出 目前 从 A 到 D 的 权 值 最 小 的 路 径 的 总 权 值 是 7.0。 在 外 部 循环 的 第 二 次 类 代 中 ， 
从 pq 里 删除 <B, 4.0> 并 连 代 通过 B 的 邻居 ， 即 D 和 E。 结 果 如 图 14-25 所 示 。 

此 时 ， 到 D 的 权 值 最 小 的 路 径 的 总 权 值 是 5.0， 到 E 的 权 值 最 小 的 路 径 的 总 权 值 是 14.0。 外 
部 循环 的 第 三 次 欠 代 中 ， 从 pq 里 删除 <D, 5.0> 并 选 代 通 过 忆 的 邻居 ， 即 和 E。 本 次 选 代 的 结果 
如 图 14-26 所 示 。 


[MA 
oc 
CA 


CA 
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weight sum predecessor pq 


A, 0.0 A «C, 2.0> 
B, 4.0 A <B, 4.0> 
C, 2.0 A <E, 15.0> 
D, 10000.0 

E, 15.0 A 

F 10000.0 

H, 10000.0 





图 14-23 Dijkstra 的 最 短路 径 算法 的 初始 化 阶段 


weight sum predecessor pq 

A, 0.0 A |». €4B,40» 
B, 4.0 A <D, 7.0> 
C, 2.0 A <E, 15.0> 
D, 7.0 C 

E, 15.0 A 

F, 10000.0 

H, 10000.0 


图 14-24 外 部 循环 的 第 一 次 迭代 之 后 ，Dijkstra 的 最 短路 径 算法 应 用 的 状态 
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weight sum predecessor pq 


A, 0.0 A «D, 5.0» 
B, 4.0 A «D, 7.0» 
C, 2.0 A «E. 14.0» 
D, 5.0 B «E, 15.0» 
E, 14.0 B 

F, 10000.0 


H, 10000.0 
图 14-25 SAWS kK Zia, Dijkstra SR kg Pe (6 9 OA P HB AR ds 


weight sum predecessor pq 


A, 0.0 A «F, 5.0» 
B, 4.0 A «D, 7.0» 
C, 2.0 A «E, 8.0» 
D, 5.0 B «E, 14.0» 
E, 8.0 D «E, 15.0» 
F, 5.0 D 

H, 10000.0 


图 14-26 外 部 循环 的 第 三 次 迭代 之 后 ，Dijkstra 的 最 短路 径 算法 应 用 的 状态 


外 部 循环 的 第 四 次 迭代 中 ， 从 pq 里 删除 <F, 5.0>; 检查 F 的 邻居 ， 即 DB 和 石 ， 并 修改 容器 。 
如 图 14-27 所 示 。 


weight_sum predecessor pq 


A, 0.0 A <D, 7.0> 
B, 4.0 A <E, 8.0> 
C, 2.0 A <H, 9.0> 
D, 5.0 B <E, 14.0> 
E, 8.0 D <E, 15.0> 
F, 5.0 D 

H, 9.0 F 


图 14-27 外 部 循环 的 第 四 次 选 代 之 后 ，Dijkstra 的 最 短路 径 算法 应 用 的 状态 


外 部 循环 的 第 五 次 迭代 开始 时 ， 从 pq 里 删除 <D, 7.0>。 目 前 ，weight_sum 中 从 A 到 DD 的 最 
小 总 权 值 就 记录 成 5.0。 因 此 在 内 部 循环 迭代 中 ，weight_sum 、predecessor 或 是 pq 都 没有 改变 。 

外 部 循环 的 第 六 次 迭代 中 ， 从 pq 里 删除 <E, 8.0> 。 因 为 我 们 想 寻 找 的 是 到 天 的 最 短路 径 ， 
所 以 至 此 就 完成 了 。 如 何 确认 没有 到 无 的 更 短 的 路 径 了 呢 ? 如 果 还 有 另 一 条 到 E 的 路 径 ， 它 的 
总 权 值 :小 于 8.0， 那 么 对 <E, t TEES RE, 8.0> 更 早 从 pq 中 删除 。 

通过 漂 加 E、E 的 前 任 D、D 的 前 任 8 和 8B 的 前 任 4， 从 predecessor 来 构造 最 短路 径 ， 即 一 -个 
顶 斥 列表。 那么 列表 的 顺序 将 是 正确 无 误 的 : 

A, B, D, E | 

对 Dijkstra 的 算法 的 描述 遗漏 了 少许 细节 。 例 如 ， 顶 点 、 边 和 邻居 将 如 何 存储 ? 14.6 节 中 
开发 了 一 个 类 ， 该 节 提 供 了 许多 漏 掉 的 细节 ， 这 些 细节 不 仅 涉及 到 Dijkstra 的 算法 ， 而 且 涉 及 

到 所 有 与 图 相关 的 工作 。 








ck a: 


14.6 ”开发 一 个 网 络 类 


本 章 介 绍 了 6 个 数据 结构 : ICRA. (ale) H., EaR., (Am) 树 ， 无 向 网 络 和 (有 向) 
网 络 。 我 们 希望 为 这 些 结 构 开 发 一 些 类 ， 它 们 的 代码 可 最 大 共享 。 面 向 对 象 的 解决 方案 是 利 
用 继承 ， 但 是 精确 地 说 该 怎么 做 呢 ? 如 采 令 directed_graph 类 是 undirected_graph 的 一 个 子 类 ， 
”那么 实际 上 ， 所 有 和 边 相 关 的 代码 必须 被 覆盖 。 这 是 因为 在 一 个 无 向 图 里 ， 每 条 边 (4, BRE 
了 两 个 连接 : 从 4 到 8B 和 从 B 到 A4。 同 样 ， 为 图 编写 的 代码 用 于 网 络 时 也 必须 重新 编写 。 

为 了 代码 的 重用 ， 我们 定义 了 一 个 (有 向 ) network 类 ， 并 将 其 他 的 图 类 定义 为 network 的 
FR. 

一 个 更 好 的 方法 是 定义 (有 问 ) network 类 ， 并 令 其 他 类 成 为 该 类 的 子 类 。 例 如 ， 可 以 把 
一 个 undirected_network 容 器 看 作 是 directed_network 容 器 ， 它 的 每 条 边 都 是 双向 的 。 因 此 将 边 
(A, Bis JllidE— ^ undirected network zz 2$ 8J 7j dag. Y. «b: 

HIT: 如 果 边 <v1,v2> 已 经 在 这 个 无 向 网 络 中 ， 那 么 返回 假 。 否 则 ， 将 这 条 

i 边 以 及 给 定 的 weight 播 入 这 个 无 向 网 络 并 返回 真 。 


bool insert_edge (const vertex& v1, const vertex v2, double& weight) 
{ 

if (contains_edge (v1, v2)) 

return faise; 

network::insert_edge (v1, v2, weight); 

network::insert_edge (v2, v1, weight); 

return true; . 
//network 的 子 类 undirected_network 类 中 的 insert_edge 方 法 


(在 这 个 方法 定义 里 ， 必 须 使 用 作用 域 解析 运算 符 一 一 即 operator:: 一 一 指明 所 调用 的 方 
法 是 network 的 insert_edge 方 法 ， 而 不 是 undirected_network 类 的 insert_edge 方 法 。) 

此 外 ， 还 可 以 将 一 个 有 向 图 看 作 一 个 网 络 ， 其 中 所 有 的 权 值 都 是 1.0。directed_graph 类 将 
包含 下 列 方法 : 

UERR: 如 果 在 本 次 调用 前 ，<v1,v2> 不 是 这 个 directed_graph 中 的 边 ， 


I 那 就 将 它 加 入 这 个 directed_graph 并 返回 真 。 否 则 就 返回 假 。 
boolean insert_edge(const vertex& v1, const vertex& v2) 
{ 


network: :insert_edge(v1,v2,1.0); 
HM/network 的 子 类 directed_graph 类 中 的 insertEdge 方 法 
14.7 节 中 开发 了 一 个 ( 有 向) network 类 。 我 们 把 子 类 undirected_graph、 directed graph, 
undirected tree, 、directed_tree 和 undirected_network 的 开发 留 作 习题 。 | 58 


14.7 network 类 


开发 类 的 首要 问题 是 确定 该 类 中 应 当 包含 的 公有 方法 : 这 些 组 成 了 用 户 角度 的 类 。 对 网 
络 类 而 言 ， 需 要 有 与 顶点 相关 的 方法 ， 以 及 与 边 相 关 方法 和 网 络 整体 的 方法 。 先 从 与 顶点 相 
大 的 方法 开始 〈14.7.7 节 中 给 出 了 时 间 估 算 ): 


/后 置 条 件 : 如 果 这 个 网 络 包含 v 就 返回 真 ; BA. BAR, 
bool contains_vertex(const vertex& v); 


oo 
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HERR: 如 果 V 已 经 在 这 个 网 络 中 就 返回 假 。 否 则 ， 将 v 加 入 这 个 网 络 并 返回 真 、 


bool insert_vertex(const vertex& v); 


NEBR. 如 果 v 是 这 个 网 络 里 的 一 个 项 点， 那么 就 从 网 络 中 删除 Vv 以 及 所 有 
i MERENS., FRAR., BW, REAR. 


bool erase_vertex(const vertex& v); 
下 面 是 与 边 相 关 的 方法 的 接口 : 
/后 置 条 件 : 返回 这 个 网 络 中 边 的 数量 。 


unsigned int get_edge_count(); 


HERE RU: 如 果 <v1,v2> 组 成 了 这 个 网 络 中 的 一 条 边 ， 那么 就 返回 该 边 的 权 值 。 
7 否则 ， 返 回 -1。 
double get_edge_weight(const vertex& v1, const vertex& v2); 


/后 置 条 件 : 如 果 这 个 网 络 包含 了 边 <v1,v2> 就 返回 真 。 否 则 ,返回 假 。 
bool contains_edge(const vertex& v1, const vertex& v2); 


// 后 置 条 件 : 如 果 边 <v1,v2> 已 经 在 这 个 网 络 中 ， 就 返回 假 。 否 则 ， 将 它 以 及 
// 给 定 的 权 值 插入 这 个 网 络 并 返回 真 ， 
bool insert_edge(const vertex& v1, const vertex& v2, const double& weight); 


// 后 置 条 件 : 如 果 <v1,v2> 是 这 个 网 络 中 的 一 条 边 ， 就 删除 这 条 边 并 返回 真 。 
ll 否则 ， 返 回 假 。 
bool erase_edge(const vertex& v1, const vertex& v2): 


最 后 是 应 用 于 整体 网 络 的 方法 的 接口 ， 包 含 了 三 个 辅助 达 代 器 : 
// 后 置 条 件 : 这 个 网 络 为 空 。 


network(); 


VaR: 这 个 网 络 包含 了 对 other 的 拷贝 
network(const network& other); 


MAREE: 返回 这 个 网 络 中 的 顶点 数量 . 
unsigned int size(); 


NARR 如 果 这 个 网 络 中 没有 顶点 就 返回 真 。 否 则 ， 返 回 假 。 
bool empty(); 


// 前 置 条 件 : v 在 这 个 网 络 里 。 
// 后 置 条 件 : 返回 v 的 邻居 列表 ， 
list<vertex> get_neighbor_list(const vertex& v); 


NARRE: 如 果 这 个 网 络 是 连通 的 就 返回 真 。 否 则 ， 返 回 假 ， 


bool is connected(); 


// 前 置 条 件 : 这 个 网 络 是 连通 的 。 








Bl. ddeHi 467 





/后 置 条 件 : 返回 这 个 网 络 的 最 小 生成 树 。 


network<vertex> get_minimum_spanning_tree(); 


/后 置 条 件 : 返回 从 v1 到 v2 的 最 短路 径 以 及 它 的 总 权 值 。 
pair<list<vertex>, double> get_shortest_path(const vertex& v1, const vertex& v2); 


// 后 置 条 件 : 返回 位 于 这 个 网 络 开 头 的 迭代 器 。 


iterator begin(); 


// 后 置 条 件 ， 返 回 的 迭代 器 可 以 用 在 比较 关系 中 ， 以 终止 这 个 网 络 里 的 迭代 ， 
iterator end(); 


/前 置 条 件 : 顶点 v 在 这 个 网 络 里 。 | 
/后 置 条 件 : 返回 一 个 广度 优先 迭代 器 (breadth first iterator) ， 它 通过 从 v 可 达 的 所 有 顶点 。 
breadth_first_iterator breadth_first_begin(const vertex& v); 


// 后 圳 条件， 返回 breadth_first_iterator ， 它 可 以 用 在 比较 关系 中 ， 以 终止 这 个 
if 网 络 里 的 迭代 。 
breadth_first_iterator breadth_first_end(); 


// 前 置 条 件 : 顶点 v 在 这 个 网 络 里 。 
// 后 置 条 件 : 返回 一 个 深度 优先 迭代 器 (depth_first_iterator) ， 它 通过 从 Vv 可 达 的 所 有 顶点 。 
depth first iterator depth first begin(const vertex& v); 


/后 置 条 件 : 返回 depth_first_iterator， 它 可 以 用 在 比较 关系 中 ， 以 终止 这 个 
// 网 络 里 的 迭代 。 | Bm | 
depth first. iterator depth_ first_end(); 


ftget minimum spanning treef§F i; X. rb, 返回 类 型 是 network， 而 不 Bree. 这 是 因为 
tree 是 directed_graph 的 子 类 ， 它 当中 的 每 条 边 的 权 值 是 1.0。 因此 get_minimum_spanning_tree 
方法 返回 一 个 network， 其 中 有 一 个 特别 指定 的 项 ， 称 作 根 ， 并 县: 

D 没有 边 进 入 根 项 。 

2) 每 个 非 根 项 上 恰好 有 一 条 边 进入 它 。 

3) 从 根 项 到 每 个 其 他 项 之 间 有 一 条 路 径 。 

4) 每 条 边 有 一 个 非 负 权 值 。 | 


14.7.1 netw9rk 类 中 的 字段 


照例 ， 要 设计 一 个 类 ， 类 本 决策 涉及 到 字段 的 选择 . 在 (有 向 ) network 类 中 ， 将 每 个 顶 
扩 v 与 所 有 使 得 <v,w> 组 成 一 条 边 的 顶点 w 相 关联 。 由 于 这 是 一 个 网 络 ， 所 以 如 果 <v,m> 组 成 了 
一 条 边 ， 那 么 就 把 每 个 这 样 的 顶点 w 以 及 边 <v,w> 的 权 值 一 起 包含 进来 。 

可 以 将 整体 组 织 改 述 如 下 : 把 网 络 中 的 每 个 顶点 v 和 所 有 下 列 形式 的 对 相关 联 : 


W ,weight 


其 中 <vw> 组 成 了 给 定 weight 的 边 。 现在 仍 存在 两 个 问题 将 使 用 什么 样 的 容器 保存 关联 ， 以 
及 将 使 用 什么 样 的 容器 保存 和 给 定 顶点 相关 联 的 “全 部 的 对 ”? 要 回答 第 二 个 问题 ， 预先 并 








468 | KIHE 


不 知道 将 有 多 少 对 ， 并 且 对 的 顺序 也 不 重要 。 我 们 可 能 希望 迭代 通过 和 一 个 给 定 顶点 关联 的 
全 部 对 ， 因 此 选择 了 一 个 list 容 器 来 保存 对 。 

最 后 ， 需 要 一 个 容器 将 每 个 顶点 v 和 对 <w,weight> 的 列表 容器 相关 联 ， 其 中 <v,w> 契 权 值 
为 weight 的 一 条 边 。 这 个 关联 的 重要 特点 是 ,给 定 一 个 顶点 v, 希望 能 快速 地 访问 关联 list 容 器 。 
术语 “关联 ”暗示 着 将 把 每 个 质点 “映射 ”到 它 的 list 容 如 。 为 了 加 速 平 均 访问 速度 ， 需 要 使 
用 一 个 hash_map 容 器 。 回 忆 在 第 13 章 中 ， 揪 入、 删除 或 查找 一 个 hash_map 容 器 的 平均 时 间 花 
费 是 前 数 一 一 假定 均匀 散 列 设想 成 立 。 

A3EHJAE, hash map 目前 仍 不 是 标准 模板 库 的 一 部 分 ， 因 此 ， 为 了 可 移植 性 ， 将 使 用 
map 类 来 替换 。 回 忆 在 第 10 章 中 ， 揪 入、 删除 或 查找 一 个 map 容 器 的 最 坏 时 间 花 费 和 z 成 对 数 
关系 。 虽 然 没 有 hash_map 类 的 平均 时 间 快 ， 但 已 经 相当 好 了 ,并且 比 hash_map 类 的 最 坏 时 间 
花费 【和 7 成 线性 关系 ) LRS. 

network 类 的 头 是 : 

template<class vertex, class Compare=less<vertex>> 

class network; 

map 类 需要 第 二 个 模板 参数 。 也 就 是 说 ， network 类 的 用 户 提供 了 一 个 模板 变 元 ， 指明 如 何 
比较 顶点 。 这 些 比 较 决 定 了 顶点 -列表 对 将 在 map 容 器 (可 能 是 一 个 红 黑 树 ) 中 储存 的 位 置 。 

network 类 中 惟一 的 字段 是 : 

protected: 

map. class adjacency map; 
其 中 map_class 是 通过 如 下 方式 定义 的 : 


typedef map<vertex,list<vertex_weight_pair>,Compare> map. class; 


在 network 类 的 邻接 表 的 设计 中 ， 疏 一 的 字段 是 一 个 map 对 象 adjacency_map， 其 中 每 个 刍 
是 一 个 顶点 并 且 每 个 值 都 是 键 的 邻居 (以 及 权 值 ) 的 链表 。 

回想 一 下 ，map 类 里 的 每 个 值 都 是 一 个 对 。 在 adjacency_map 容 器 中 ， 每 个 值 将 由 一 个 顶 
所- 列表 对 组 成 ， 其 中 顶点 是 键 ， 而 列表 包含 了 和 键 邻接 的 每 个 顶点 ， 以 及 相应 边 的 权 值 。 这 
个 设计 被 称 作 是 邻接 表 设 计 。 | | | | 

如 果 itr 是 map_class::iterator 类 型 的 ， 那 么 *itr 返 回 一 个 对 。 明 确 地 培 ，(*itD first 是 一 个 顶 
扩 ， 并 且 ("itr).second 是 该 顶点 的 邻接 表 。 邻 接 表 中 的 项 是 vertex_weight_pair 类 型 的 ， 即 包含 
to 和 weight 字 段 (分 别 是 vertex 和 double 类 型 ) 的 结构 。 这 些 字段 比 “ 对 ”结构 中 的 first 和 
second 字 段 容易 理解 ， 因 此 读者 应 该 不 会 混淆 vertex_weight_pair 项 和 脱 引 用 映射 迭代 器 返回 
的 对 。 使 用 vertex_weight_pair 结 构 的 另 一 优势 是 可 了 以 重 载 9perator> 用 于 优先 队列 的 比较 。 

下 面 是 vertex_weight_pair 的 定义 : 

struct vertex_weight_pair | 


{ 
vertex to; 
double weight; 
// 后 置 条 件 : 通过 x 和 y 初 始 化 这 个 vertex_weight_pair。 


O ”回忆 一 下 ， 结 构 是 一 个 类 ， 它 的 所 有 成 员 都 是 pubtic 的 。 
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. vertex weight pair(const vertex& x, const double& y) 


{ 
to=x; 
weight=y; 

M/ 两 个 参数 的 构造 器 


// 后 置 条 件 : 如 果 这 个 vertex_weight_pair 小 于 x 就 返回 真 。 否 则 ， 
// iR [abi 
bool operator>(const vertex weight pair& p) const 
( 
return weight>p.weight;// 权 值 最 小 的 具有 最 高 的 优先 级 ， 
Whe RF 
)//vertex weight pair3k 


14.7.2 network 类 的 实现 


由 于 类 中 惟一 的 字段 是 一 个 map， 所 以 几 个 方法 的 定义 都 很 简单 ， 因 为 很 多 工作 都 已 经 在 
相应 的 map 方 法 中 完成 了 : 


network( ) { } 


network (const network& other) 


{ 


adjacency_map = other.adjacency. map; 


} // 拷贝 构造 器 


unsigned size( ) 


{ 


return adjacency map.size( ); 
) // size 方 法 


bool empty( ) 
{ 


return size( ) == 0: 


y empty 方 法 


bool contains_vertex (const vertex& v) | 
{ 

return adjacency_map.find (v) != adjacency_map.end( ); 
) // contains, vertox7; ik 


network 类 中 这 些 以 及 其 他 方法 的 时 间 花 费 将 在 14.7. 7 节 中 探讨 。 
向 network 容 器 插入 一 个 顶点 v 是 很 直接 的 。 如 果 v 不 在 网 络 中 ， 就 使 用 关联 数组 运算 符 将 
对 <v, empty list> 插 入 adjacency_map 容 器 。 下 面 是 insert_vertex 的 定义 : 
bool insert_vertex (const vertex& v) 
C | 
if (adjacency map.find (v) != adjacency map.end( )) 


CA 
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return false; 
adjacency map [v] = list< vertex weight pair >( ); 
return true; 
) // insert. vertex7; Æ$ 


erase_yvertex 的 定义 需要 费 一 番 工 夫 。 从 adjacency_map 中 删除 一 个 顶点 v 是 很 简单 的 ， 删 
除 从 v 出 发 的 边 的 关联 列表 也 是 如 此 。 但 是 还 必须 删除 每 条 进入 v 的 边 。 因 为 边 的 信息 是 以 顶 
点 - 权 值 对 的 形式 存储 在 一 个 列表 里 ， 所 以 必须 选 代 通过 network 罕 器 中 的 全 部 顶点 。 对 每 个 
顶点 都 要 迭代 通过 它 的 对 列表 来 寻找 v。 只 要 发 现 v 在 某 个 对 中 ， 就 从 列表 里 删除 该 对 。 下 面 


是 erase_vertex 的 定义 : 


bool erase_vertex (const vertex& v) 
{ 
map_class::iterator itr = adjacency_map.find (v); 
if (itr == adjacency_map.end( )) 
return false; 
adjacency_map.erase (itr); 
list<vertex_weight_pair>::iterator list. itr; 
for (itr = adjacency map.begin( ); itr != adjacency map.end( ); itr+ +) 
// 在 (“itr).second 的 列表 中 ， 删 除 所 有 的 <v, ?> 对 
for (list itr = (‘itr).second.begin( );list_itr !— (*itr).second.end( ); 
list_itr+ +) | 
if (("list itr).to == v) 
{ 
(“itr).second.erase (list itr); 
break; // 退出 内 部 for 循 环 
) // 在 ("itr).second 列 表 中 找到 的 V 
return true; 
) // erase vertex 


14.7.3 与 边 相 关 的 方法 的 实现 


现在 继续 考虑 与 边 相 关 的 方法 。 为 了 计算 network 容 器 中 边 的 数量 ， 可 以 利用 任何 顶点 的 
关联 list 容 如 的 大 小 代表 了 从 该 顶点 出 发 的 边 的 数量 这 一 事实 。 因 此 ， 可 以 友 代 通过 网 络 中 的 
594| 全 部 顶点 ， 并 累计 关联 list 容 器 的 大 小 。 定 义 如 下 : 


unsigned get_edge_count( ) 
{ 


int count = 0; 
map_ciass::iterator itr; 


for (itr = adjacency_map. begin( ); itr !— adjacency_map. end( y; itr++) 
count += (*"itr).second.size( ); 
return count; 
) // get edge count $ 


边 的 权 值 计 算是 相似 的 。 要 求 <vl, v2> 的 权 值 ， 可 述 代 通 过 v1 的 关联 列表 ， 寻 找 顶 点 是 v2 
的 对 。 如 果 找 到 ， 就 返回 该 对 的 权 值 ; 否则 就 返回 -1.0， 说 明 <vl, v2> 不 是 网 络 中 的 边 。 定 义 
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如 下 : 


double get_edge_weight (const vertex& v1, const vertex& v2) 
{ 
map_class::iterator itr = adjacency_map.find (v1); 
if (itr == adjacency map.end( ) 
|| adjacency_map.find (v2) == adjacency. map.end( )) 
return — 1.0; 
/f 3k fi isi v1 89 458 90 a: 
listcvertex weight, pair >::iterator list. itr; 
for (list itr = ((“itr).second).begin( ); list, itr {= ((*itr).second).end( ); 
list itr +) 
if (("list itr).to == v2) 
return (“list_itr). weight; // 3& [s] «v1, v2» 8 1 48 
return —1.0; // 网 络 中 没有 <v1,v2> 边 
) // get edge weight 


相似 的 迭代 可 以 用 来 判断 网 络 是 否 包 含 一 条 给 定 的 边 : 
bool contains_edge (const vertex& v1, const vertex& v2) 
{ 
map. class:iiterator itr = adjacency_map.find (v1); 
if (itr == adjacency map.end( ) 
|| adjacency_map.find (v2) == adjacency_map.end( )) 
return false; | 
ll 考察 v2 是 否 在 v1 的 邻接 顶点 列表 里 : 
list<vertex_weight_pair >::iterator list. itr; 
for (list itr = ((*itr).second).begin( ); list itr 1= (("itr).second).end( ); 
list. itr-- +) 
if (("list itr).to == v2) 
return true; 
return false; 
) // contains edge7iiX 


删除 一 条 边 的 代码 也 是 相似 的 : 


bool erase_edge (const vertex& v1, const vertex& v2) 
| 
map. class::iterator itr = adjacency map. find (v1); 
if (itr == adjacency map.end( ) 
|| adjacency_map.find (v2) == adjacency, map.end( )) 
return false; 
/ 如 果 <v1, v2> 组 成 了 一 条 边 ， 就 从 v1 的 邻接 边 列表 里 
/ 删除 边 <v1, v2> 以 及 该 边 的 权 值 : 
list<vertex_weight_pair >::iterator list. itr; 
for (list itr = (*itr).second.begin( ); list itr !— (*itr). second. endi ); 
list_itr+ +) 
if ((“list_itr).to == v2) 
{ 


(“itr).second.erase (list itr); 
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return true; 
) // if 
return false; 
) // erase_edge 方 法 


添加 边 <v1， v2> 需 要 将 vertex_weight_pair<v2.weight> 加 入 v2 的 关联 邻接 表 中 : 


bool insert_edge (const vertex& v1, const vertex& v2, double weight) 


{ 

if (contains_edge (v1, v2)) 

return false; 

insert_vertex (v1); 

insert_vertex (v2); 

(*(adjacency_map.find(v1))).second.push_back (vertex weight pair - 

(v2, weight)); 
return true; 

) // insert. edge7i;x 


14.74 全 局 方法 的 实现 


最 后 讨论 应 用 于 整体 网 络 的 方法 。 迭 代 通 过 一 个 顶点 关联 的 邻接 表 可 以 得 到 该 顶点 的 邻 
FE FUR . 邻接 表 中 每 个 vertex_weight_pair 项 里 的 to 顶点 被 添加 进 一 个 初始 为 空 的 列表 。 定义 
如 下 : 


list<vertex > get_neighbor_list (const vertex& v) 
{ 
list<vertex_weight_pair>::iterator list_itr; 
list<vertex> vertex_list; 
for (list itr = adjacency map [v].begin( ); list_itr {= 
adjacency. map[v].end( ); list, itr-- +) 
vertex list.push back (list itr — to); 
return vertex list; 
) // get neighbor list75 3X 


BF Pd eR dé dE. WR Pea. ME Pa. [ERIT eK 
fas 38 Falls A v TX RO TOR es ETT ES v, 如 果 从 v 可 达 的 顶点 数量 小 于 网 络 中 的 顶点 数量 ， 
那么 网 络 不 是 连通 的 ; 否则 ， 网 络 就 是 连通 的 。 下 面 是 它 的 定义 : 


bool is_connected( ) 
{ 
map_class::iterator itr; 
l 对 每 个 顶点 Y， 检 查 从 v 可 达 的 顶点 数量 是 否 等 于 S 
I] 这 个 网 络 中 项 点 的 总 数量 。 | | 
for (itr = adjacency map.begin( ); itr != adjacency. map.end( );itr+ +) 


{ 


vertex v = (‘itr).first; 
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/ 计数 从 Vv 可 达 的 顶点 数量 
unsigned count = 0; 
breadth_first_iterator b_itr; | 
for (b itr = breadth first begin (v); b. itr !— breadth first end( y 
b_itr+ +) 
count+ +; 
if (count < adjacency. map.size( )) 
return false; 


) / 迭代 通过 网 络 中 的 全 部 顶点 。 
return true; 
) // is connected7 3% 


为 了 从 一 个 start 顶 点 开始 执行 网 络 的 广度 优先 迭代 ， 需 要 了 解 的 不 仅仅 是 start 顶 点 ， 而 且 
还 有 网 络 。 邻 接 映 射 将 为 第 二 个 参数 服务 ， 但 我 们 并 不 需要 该 映射 的 单独 的 拷贝 。 
breadth_first_begin 方 法 把 start 顶 点 和 adjacency_map 的 地 址 发 送 给 breadth_first_iterator 类 中 的 
构造 器 : 

// Bj NES TE: 顶点 v 在 这 个 网 络 里 。 

/ 后 置 条 件 : 返回 一 个 breadth_first_iterator， 它 通过 


if 所 有 从 V 可 达 的 顶点 。 | 
breadth first iterator breadth first begin (const vertex& v) 


{ 


breadth_first_iterator b_itr (v, &adjacency_map); 
return b_ itr; 
) // breadth first. begin + 


breadth_first_iterator 类 遵循 了 14.5.1 节 中 给 出 的 框架 。 为 了 能 快速 判断 一 个 给 定 顶点 是 否 
AIA, 4reached%)<vertex, boopP 形 式 的 对 的 映射 (指向 映射 的 指名) 这 是 另 一 种 对 ! 头 和 
字段 是 : 


class breadth_first_iterator 


{ 


friend class network; 
protected: 
queue<vertex>* vertex queue; 


map« vertex, bool, Compare» * reached; 
map. class* map. ptr; 


A LH I BEE BE AUBG. ALAR BB BE Hb RE ER EGA ROS IHR ABER: 比较 
eet, MPBARMIES. breadth_first_iterator 的 两 个 参数 的 构造 器 的 参数 是 一 个 start 顶 点 
和 一 个 映射 指针 。 映 射 指针 参数 被 赋 给 map_ptr 字 段 ， 然后 初始 化 reached 和 vertex_queue 字 段 。 
对 每 个 顶点 vY， 将 对 <v,false> 插 入 *reached。 然 后 把 对 <start jirue> 插 人 *reached。 再 将 start 推 入 
“Vertex_gqueue。 代 码 如 下 : 


/ RER: 在 start 顶 点 上 初始 化 这 个 breadth_first_iterator 


breadth_first_iterator (const vertex& start, map_class* ptr) 
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map_ptr = ptr; 

reached = new map<vertex, bool, Compare>( ); 

vertex queue = new queue <vertex>( ); 

// 将 每 个 顶点 标记 为 不 可 达 的 : 

map_class::iterator itr; 

for (itr = (*map ptr).begin( ); itr !— (*map. ptr).end( ); itr+ +) 
(*reached)[('itr).first] = false; 

('reached)[start] = true; 

('vertex queue).push (start); 


} // 两 个 参数 的 构造 器 


后 加 运算 符 operator++ 从 *vertex_queue 队 列 的 开头 取出 顶点 ， 将 和 该 顶点 邻接 的 所 有 
尚未 到 达 的 顶点 插入 队列 ， 并 且 当 *vertex_queue 为 空 时 清空 字段 (和 end() 方 法 比较 )。 定 义 


如 下 : 


// 前 置 条 件 : 这 个 breadth_first_iterator 尚 未 到 达 这 个 网 络 的 所 有 可 达 顶 点 。 
/后 置 条 件 : 这 个 breadth_first_iterator 前 进 到 这 个 网 络 的 下 一 个 可 达 顶 点 ; 


// 


3& [e] Bi aE BY 93 f, 


breadth first iterator operator-- + (int) 


{ 


breadth first iterator temp = "this; 
vertex current — (*vertex queue).front( ); 
('vertex queue).pop( ); 


map. class::iterator itr = (*map ptr).find (current); 
listc vertex weight pair-::iterator list itr; — 


// 迭代 通过 current 的 邻居 : 

for (list itr = (*itr).second.begin( ); list itr != ('itr).second.end( ); 
list. itr-- +) 

{ 


vertex to = ("list itr).to; 


// 到 达 过 项 点 to 吗 ? 
if ((“reached) [to] == false) 
{ 
(“reached) [to] = true; 
(vertex queue).push (to); 
) // if 
) // for 
if (vertex queue).empty( )) 
( 
vertex queue = NULL; 
reached = NULL; 
map_ptr = NULL; 
) // 如 果 队 列 为 空 


return temp; 


}/ 运算 符 ++ 
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operator== 测 试 字段 是 否 相 等 ， 而 脱 引用 运算 符 operator 返回 "vertex_queue 开 头 的 顶 
点 。depth_first_iterator 类 和 breadth_first_iterator 类 之 间 惟 一 的 重要 差别 是 使 用 vertex_stack 圭 
fÈ f vertex queue, ' 


14.7.5 get minimum. spanning. tree7j ik 


get_minimum_spanning_tree 方 法 的 定义 遵循 了 14.5.3 节 中 给 出 的 框架 。 从 基 些 作为 根 的 顶 
点 开始 ， 并 获取 和 该 根 关联 的 vertex_weight 对 列表 。 将 每 个 这 样 的 边 三 元 组 <root, vertex, 
weight> 推 入 一 个 优先 队列 。 然 后 从 优先 队列 中 弹出 权 值 最 小 的 三 元 组 <x, y, weight>， 直 到 生 
成 树 的 大 小 等 于 网 络 的 大 小 。 如 果 y 不 在 生成 树 中 ， 就 把 y 和 边 <x, y> 以 及 权 值 加 入 生成 树 ， 并 
和 代 通过 y 的 邻居 ; 如 果 邻 居 z 不 在 生成 树 里 ， 那 么 就 把 边 三 元 组 <y, z, <y, z> 边 的 权 值 > 推 入 优 
先 队 列 。 

为 了 更 方便 , 创建 了 edge_triple 结 构 , 这 使 得 我 们 可 以 很 容易 地 访问 一 条 边 以 及 它 的 权 值 ， 
并 定义 了 三 元 组 优先 队列 需要 的 operator>。get_minimum_spanning_tree 的 定义 是 : 


network<vertex> get_minimum_spanning_tree( ) { 


network min spanning. tree; // 最 小 生成 树 是 一 个 网 络 ， 这 样 可 以 
/ 在 其 中 包含 权 值 。 
priority_queue<edge_triple, vector<edge_triple>, 
greater<edge_triple> > pq; 


vertex root, 
X, 
y. 
Z, 
iterator itr; 


_ list< vertex weight pair > adjacency list; 
list vertex weight pair >::iterator list_itr; 
double weight; 


If (empty( )) | 
return min spanning tree; 

itr = begin( ); | 

root = ('itr).first; 

min. spanning. tree.insert, vertex (root); 


adjacency list = adjacency map [root]; 
for (list itr = adjacency list.begin( ); list. itr != adjacency_list.end( ); 
list. itr-- +) | 
pq.push (edge triple (root, list itr — to, list, itr — weight); 
while (min. spanning tree.size( ) < size( )) 
{ 
X = pq.top( ).from; 
y = pq.top( ).to; 
weight = pq.top( ).weight; 
pq.pop( ); 
if (min spanning tree.contains vertex (y)) 
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min_spanning_tree.insert_vertex (y); 
min_spanning_tree.insert_edge (x, y, weight); 


adjacency list = adjacency map [y]; 


for (list itr = adjacency_list.begin( ); 
list itr != adjacency list.end( ); 
list_itr+ +) 


z = list itr -> to; 
if (min spanning tree.contains vertex (z)) 
{ 
weight = list_itr -> weight: 
pq.push (edge triple (y, z, weight)); 
) // z 还 不 在 树 中 
}/ 迭代 通过 y 的 邻居 
}Wy 还 不 在 树 中 
}V 树 的 项 点 数 少 于 这 个 网 络 的 顶点 数量 
return min_spanning_tree; | 
) // get minimum spanningTree7; $ 


14.7.6 get shortest path7j;X 


最 后 来 定义 get_shdrtest_path 方 法 ， 它 返回 从 顶点 v1 到 顶点 v2 的 总 权 值 最 小 的 路 径 。 正 如 


14.5.4 节 给 出 的 框架 一 样 ， Dijkstra 的 算法 是 从 v2 开始 的 广度 优先 迭代 。priority_queue 容 器 pq 


由 <w, total_weight> 形 式 的 对 组 成 ， 其 中 total_ weight 是 迄今 得 到 的 从 v1 到 w 的 最 短路 径 上 所 有 
边 的 权 值 总 和 。 优 先 队 列 按照 最 小 总 权 值 排序 。 为 了 记录 从 v1 出 发 的 所 有 局 部 路 径 的 总 权 值 ， 
使 用 了 一 个 映射 weight_sum， 它 将 每 个 顶点 w 和 迄今 得 到 的 从 v1 到 w 的 最 短路 径 上 所 有 边 的 权 
值 总 和 相关 联 。 为 了 能 在 通过 时 重新 构造 最 短路 径 ， 还 使 用 了 7a — ^ máp 8$ predecessor, 它 
将 每 个 顶点 w 和 迄今 得 到 的 从 v1 到 w 的 最 短路 径 上 w 的 直接 前 任 相 关联 。 
最 初 ，list_itr 迭 代 通 过 所 有 vertex_ weight 对 <w, wweight> 的 邻接 表 ， 其 中 <v1， woe el 
为 wweight 的 边 。 对 每 个 对 *list_itr: 
weight_sumllist_itr->to]=list_itr->weight; 
predecessor[list itr-5to]-v1; 
pq.insert(*list itr); 
其 他 所 有 顶点 的 初始 权 值 为 MAX_PATH WEIGHT. 
然后 从 pq 中 再 三 弹出 最 小 总 权 值 的 顶点 from。 接着 list_ itr 潜 代 通过 所 有 <to、 weight> 对 的 
邻接 表 ， 其 中 <from， to> 是 权 值 为 weight 的 边 。 每 个 对 <to， weight>: 
if (weight_sum [from] + weight < weight_sum [to]) 
{ | 
weight sum [to] = weight sum [from] + weight; 
predecessor [to] = from; 
pq.push (vertex weight pair (to, weight sum [to])); 
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从 pq 中 弹出 v2 时 ， 将 前 任 顶点 添加 到 一 个 链表 中 并 和 最 短路 径 的 总 权 值 一 起 返回 。 定 义 
如 下 : 


pair<list<vertex>, double> get_shortest_path (const vertex& v1, 
const vertex& v2) 


{ 
const double MAX_PATH_WEIGHT = 1000000.0; 


map<vertex, vertex, Compare> predecessor; 

map<vertex, double, Compare> weight sum; 

priority queue«vertex weight pair, 
vector« vertex weight pair, 
greater« vertex weight pair- > pq; 


list vertex weight pair >::iterator list itr; 


breadth. first iterator b itr; 


vertex to, 
from; 


double weight; 


if (adjacency map.find (v1) == adjacency_map.end( ) || 
adjacency map.find (v2) == adjacency. map.end( )) 
return pair<list<vertex>, double- (list<vertex>(), — 1.0); 


bool found v2 - false; 
for (b itr = breadth first begin (v1); b itr != breadth, first, end( ); 
b itr-- +) | 
if ("b itr == v2) | ` 
{ | 
found v2 = true; 
break; 
) // if 
if (!found v2) 
return pair<list<vertex>, double> (list<vertex>(), — 1.0); 


weight sum [v1] = 0. 0; 
predecessor [v1] = v1; 
for (b_itr = breadth first. . begin (v1); b_ itr {= breadth. first -end( ); 
b_itr+ +) 
{ 
weight sum [*b_itr] = MAX PATH. WEIGHT; 
| predecessor [*b itr] — vertex( ); 
yl 初始 化 weight- sum 以 及 前 任 | 
for (list_ itr = adjacency_map [v1]. begin ); list_ itr {= 
|  adjaceficy map [v1]. end( ); list_ itr+ +) 
| 
weight sum [list itr - -> to] = list itr — > weight; 
predecessor [list itr — to] = v1; 
pq.push (vertex weight pair (*list. itr); 
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) // 调整 v1 邻 接 顶 点 对 应 的 weight_sum、predecessor、pq 


bool path_found = false; 
while (!path_found) 
{ 
from = pq.top( ).to; // 获取 vertex_weight_pair 中 权 值 
// 总 和 最 小 的 顶点 
pq.pop( ); 
if (from == v2) 
path_found = true; 
else 
{ 
for (list itr = adjacency map [from].begin( ); 
list itr !— adjacency map [from].end( ); list. itr-- +) 
{ 
to = list_itr -> to; 
weight = list_itr -> weight: 
if (weight sum [from] + weight < weight sum [to]) 
{ 
weight sum [to] = weight sum [from] + weight; 
predecessor [to] — from; 
pq.push (vertex weight pair (to, 
weight sum [to])); 
) // $n 5Rfrom. weight sum-weight»to weight sum 
) // 迭代 通过 from 的 列表 
) / 否则 就 是 没有 找到 路 径 
) // 当 没有 找到 路 径 时 
list<vertex> path; 
vertex current = v2; 
while (current != v1) 


{ 
path.push_front (current); 
current = predecessor [current]: 
) // 当 尚 未 返回 v1 时 
path.push_front (v1); 


return pair<list<vertex>, double> (path, weight sum [v2]); 
) // get shortest path7j $ 


14.7.7 网 络 方法 的 时 间 花 费 估算 


令 V 是 网 络 中 的 顶点 数量 ，E 是 边 的 数量 。 为 了 简单 起 见 ， 这 里 只 考虑 平均 时 间 花 费 。 基 
本 上 ， 如 果 一 个 方法 需要 迭代 通过 所 有 顶点 而 不 通过 关联 列表 ， 那么 averageTime(V, E) 和 VY 成 
线性 关系 。 这 是 因为 adjacency_map 和 顶点 键 一 起 存储 在 一 个 红 黑 树 里 ， 并 且 选 代 通 过 顶点 需 
要 VY 的 线性 时 间 。 和 迭代 通过 单个 顶点 的 邻接 表 的 averageTime(V, E) 是 O(logV+E/V)， 因 为 在 红 
党 树 里 访问 一 个 顶点 ( 即 一 个 键 ) 花费 logV 时 间 ， 而 V 个 列表 中 共有 E 条 边 。 

get_edge_count 方 法 迭代 通过 所 有 顶点 ， 因 此 averageTime(V， FE) 和 V 成 线性 关系 。 另 一 方 











面 ，get_edge_weight 方 法 迭代 通过 它 的 第 一 个 顶点 参数 所 关联 的 列表 ， 因 此 averageTime(V， 
E) 是 O(logV+E/V)， 并 且 这 也 正 是 最 小 上 界 。 

erase_vertex 方 法 首先 从 网 络 中 查找 并 删除 它 的 变 元 ， 因 此 averageTime(V,E) 和 V 成 对 数 关 
系 。 然 后 方法 迭代 通过 所 有 顶点 ， 并 且 ， 对 每 个 顶点 ， 又 迭代 通过 与 该 顶点 关联 的 列表 ， 
此 averageTime(V, E)AIV*E/V ($FE) 成 线性 关系 。 所 以 erase_vertex 的 averageTime(V ,由 是 
O(logV+E)， 并 且 这 就 是 最 小 的 。 | 

1E) RETRO BE DOCTR RT. B Ace) S IC PL iE HJ. FATE BEDLACOATA 
ARI VI. mB TT. AR Rich CHOSE. DilbaverageTime(V,E)füE 
成 线性 关系 。 深 度 优先 迭代 同上 。is_connnected 方 法 迭代 通过 所 有 顶点 并 为 每 个 顶点 执行 一 
个 广度 优先 迭代 ， 因 此 averageTime(V, E) 和 VE 成 线性 关系 。 

在 get_minimum_spanning_tree 方 法 中 ， 外 部 循环 的 迭代 次 数 和 V 成 线性 关系 。 每 次 外 部 入 
环 夺 代 中 ， 优 先 队 列 弹出 〈 需 要 logE 次 欠 代 )， 并 由 内 部 循环 迭代 通过 邻居 列表 (需要 E/V 次 
RAR), AURA RR O(VogE+E/V)). ARAaverageTime(V, E\ERAO(VIOgE+E). 3x 7 
能 不 是 最 小 上 界 ， 因 为 只 征 建 立 了 一 个 优先 队列 弹出 所 需要 的 迭代 次 数 的 上 界 。 

为 了 简化 get_ shortest_path 方 法 的 分 析 ， 假设 从 v1 到 v2 间 的 路 径 距 离 至 少 是 V/2。 那 么 对 路 

径 中 的 每 个 顶点 ， 内 部 循环 将 选 代 通过 它 的 邻居 。 因 此 ， 和 getMinimumSpanningTree 方 法 一 
M 它 的 averageTime(V, E)th 2 O(VlogE4 E). 

完整 的 network 类 以 及 驱动 器 程序 可 以 参阅 本 书 网 站 的 源 代 码 链接 。 实验 29 介 绍 了 一 个 最 

著名 的 网 络 问题 ， 进 一 步 探索 了 贪心 算法 ， 并 涉及 到 一 些 难 题 讨论 。 


实验 29: 货 郎 担 问题 (所 有 实验 都 是 可 选 的 ) 


14.7.8 network 类 的 另 一 种 设计 和 实现 


在 14.7.1 节 的 network 类 的 设计 中 ， 顶 点 是 作为 键 存储 在 一 个 map 容 器 里 的 。 每 个 值 的 另 一 
个 组 成 部 分 是 顶点 - 权 值 对 的 邻接 襄 ， 也 就 是 顶点 键 的 邻居 (以 及 边 的 权 值 ) 链表 。 这 个 结构 
很 适合 稀疏 网 络 ， 也 就 是 边 的 数量 不 大 于 顶点 数量 的 网 络 。 在 任何 连通 网 络 里 ， 一 定 有 : 
| V«E« WV41)2 


V 个 邻接 表 里 有 E 条 边 ， 因此 邻接 表 的 平均 大 小 是 E/V。 

contains_edge 方 法 需要 花费 logVy 的 时 间 访问 相应 的 邻接 表 ， 以 及 需要 E/V 的 时 间 查 找 该 列 
表 。 因 此 contains_edge 方 法 的 averageTime(V， E) 是 O(logV+E1V)。 如 果 已 知 E 和 V 的 关系 ， 就 能 
够 求 精 这 个 估算 。 特 别 是， 如果 边 的 数量 和 V 成 线性 关系 ， 那 么 每 个 邻接 表 的 平均 大 小 将 是 党 
数 ， 并 且 可 以 快速 地 迭代 通过 邻接 表 ， 以 判断 网 络 中 是 否 包 含 一 条 给 定 边 。 那 2 
contains_edge 方 法 的 averageTime(V, DAVRI HER. 

另 一 方面 ， 如 果 边 的 数量 和 V 成 平方 关系 ， 那 么 邻接 表 的 平均 大 小 将 和 VY 成 线性 关系 。 这 
暗示 着 由 于 每 次 迭代 都 需要 顺序 地 穿 过 一 个 邻接 表 ， 所 以 averageTime(V, E) 和 V 成 线性 关系 。 
那么 contains _edge 方 法 的 averageTime(V， 局 就 和 VY 成 线性 关系 。 

network 类 的 邻接 矩阵 设计 中 ,使 用 了 一 个 V 行 V 列 的 算 阵 保有 每 条 边 的 权 值 。 

为 一 种 常用 的 网 络 表 示 法 是 使 用 邻接 矩阵 而 非 邻接 表 。 邻 接 矩 阵 是 double 项 组 成 V 行 V 列 
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的 二 维 向 量 (RAH). adjacency. matrix[i][] ER £F. f£. SE iP TWO e 9 981 MARAA. X. 
们 需要 能 快速 地 将 顶点 关联 到 一 个 数组 下 标 ， 并 且 还 能 快速 地 将 下 标 关 联 到 它 的 项 点。 为 了 
这 最 后 的 任务 ， 创 建 一 个 顶点 向 量 或 数组 : vertexs[i 让 包含 了 与 adjacency_matrix[i (矩阵 中 的 


第 i 行 ) 所 对 应 的 顶点 。 


为 顶点 和 下 标 间 的 关联 创建 vertex_map 一 一 一 个 map 容 器 ， 其 中 每 个 键 是 一 个 顶点， 而 每 
个 值 中 的 另 一 个 组 成 部 分 是 与 顶点 键 对 应 的 索引 。 图 14-28 显 示 了 一 个 网 络 以 及 相应 的 邻接 矩 
阵 表 示 形 式 。 

图 14-28 假 设 了 顶点 是 按照 如 下 顺序 加 入 网 络 的 : “Karen”, “Mark”, “Don”, “Courtney”, 
“Tara"。 每 当 一 个 顶点 加 入 网 络 时 ， 该 顶点 就 被 存储 在 vertices 同 量 的 下 一 个 未 占用 索引 上 ， 
并 且 将 该 顶 氮 -索引 对 加 入 vertex_map 容 器 。 下 面 是 这 个 设计 中 的 四 个 字段 : 


vector<vector<double>> adjacency matrix; /保存 每 条 边 的 权 值 





vector<vertex> vertices: // 保 存 顶 点 
map<vertex, int> vertex_map; // 将 每 个 项 点 和 它 的 索引 关联 
int next; /下 一 个 顶点 在 vertices 中 的 索引 
Mark 
1000 ^8 
Karen “a Bu 
M^ 
0 
1 
2 
3 
4 
adjacency matrix vertices 
vertex map Karen 0 
Don 2 | Mark 1 
Courtney 3 Tara 4 


图 14-28 网 络 的 邻接 矩阵 表示 。 条 目 是 -1.0 说 明 没有 边 。 
为 了 增强 可 视 性 ， 边 的 权 值 都 用 黑体 表示 


在 缺 省 构造 器 中 ， 定 义 了 顶点 初始 数量 的 缺 省 值 。 然 后 adjacency_matrix 字 段 全 部 被 初始 
化 成 -1.0; vertices 字 段 被 分 别 初始 化 成 一 个 空间 量 ; next 被 初始 化 成 0。 
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如 果 vertex 已 经 在 网 络 里 ，insert_vertex 方 法 就 返回 false。 否 则 ， 调 整 这 四 个 字段 并 返回 
true。averageTime(V, E) 和 V 成 对 数 关 系 (除非 发 生 扩 充 }， 因 为 必须 查询 vertex_map 才 能 求 出 
给 定 顶 点 对 应 的 索引 。 定 义 如 下 : 


// 后 置 条 件 : 如 果 顶 点 已 经 在 这 个 网 络 里 或 者 网 络 已 满 ， 那 么 返回 假 。 否 则 ， 
// 将 项 点 加 入 这 个 网 络 并 返回 真 . 
bool insert_vertex (vertex v) 
{ 

if (vertex map.find (v) != vertex map.end( ) || next == 

vertices.size( ) — 1) 
return false; 

check for expansion( ); 

vertices [next] = v; 

for (unsigned i = 0; i < vertices.size( ); i++) 


adjacency matrix[next](i] = — 1.0; 
vertex map.insert (pair «vertex, int> (v, next); 
next+ +; 


return true; | 
) // insertVertex 方 法 


network 类 的 这 个 实现 的 剩余 部 分 将 在 编程 项 目 14.1 中 探讨 。 
本 章 最 后 的 论题 是 回溯 。 第 4 章 中 已 经 了 解 了 如 何 使 用 回溯 来 解决 多 种 应 用 ， 现 在 我 们 将 
应 用 领域 扩展 到 网 络 ， 当然 还 有 图 和 树 。 | 


14.8 回溯 通过 网 络 


在 第 4 章 提 到 回溯 时 ， 了 解 了 三 个 应 用 ， 其 中 的 基本 结构 都 没有 改变 ， 特别 是 使 用 了 相同 
的 BackTrack 类 和 Application 头 在 以 下 应 用 中 : 

1) 搜索 一 个 迷宫 。 

2) 在 棋盘 上 放置 八 个 皇后 一 使 得 每 一 个 者 不 会 被 其 他 皇后 攻击 到 。 

3) 阐述 了 一 个 马 可 以 遍历 棋盘 中 的 每 个 格 而 且 不 会 重复 到 达 任 意 格 。 

第 4 章 介绍 的 回溯 结构 也 可 以 用 于 回溯 通过 网 络 。 

网 络 (或 图 、 树 ) 也 适合 回溯. 例如， 假设 有 一 个 城市 网 络 ， 每 条 边 的 权 值 代表 两 个 城 
市 之 间 的 距离 7 以 英里 为 单位 。 给 定 一 个 出 发 城市 和 一 个 终点 城市 ， 寻 起 一 条 路 径 ， 其 中 每 
条 边 的 其 离 都 小 于 前 一 条 边 的 距离 。 图 14- -29 中 给 出 了 一 些 样本 数据 ， AGAR IH LR SCR aA 
市 ， 随后 给 出 了 每 条 边 。 图 14-30 描 述 了 根据 图 14- 29 的 数据 产生 的 网 络 。 

对 这 个 问题 ， 一 种 方案 是 下 面 的 路 径 : 


Boston 一 New York —* > Harrisburg —» Washington - 
更 短 的 (也 就 是 总 权 值 更 小 的 ) 路 径 是 : 
Boston — => Trenton 一 Washington 
最 短路 径 在 这 个 问题 上 是 不 合法 的 ， 因 为 它 的 距离 是 递增 的 〈 从 214 到 232 ): 


Boston —*— NewYork —— Washington 
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OS 


Boston Washington 

Albany Washington 371 
Boston Albany 166 
Boston Hartford 101 
Boston New York 214 
Boston Trenton 279 


Harrisburg Philadelphia — 106 
Harrisburg Washington 123 
New York Harrisburg 168 
New York Washington 232 
Trenton Washington 178 


Pe] 14-29 一 个 网 络 : 第 一 行 包含 了 出 发 和 终点 城市 ; 其 他 每 一 行 包含 了 
两 个 城市 以 及 从 第 一 个 城市 到 第 二 个 城市 间 的 距离 


Boston 


279 
166 101 214 


Albany Hartford New York Trenton 


168 


Harrisburg 


37] 106 123 $232 178 


Philadelphia 


. Washington 
图 14-30 一 个 城市 网 络 : 每 条 边 的 权 值 代表 这 条 边 上 的 城市 间 的 距离 
当 到 达 一 个 死胡同 时 ， 可 以 回溯 通过 网 络 。 回 滴 的 基本 策略 是 从 出 发 点 开始 利用 深度 优 
先 查 找 。 在 每 个 位 置 ， 友 代 通 过 该 位 置 的 邻居 。 访 问 的 邻居 位 置 的 次 序 就 是 相应 边 最 初 插 入 
网 络 中 的 顺序 。 因 此 可 以 保证 ， 只 要 存在 一 条 路 径 方案 ， 就 一 定 可 以 找到 ， 但 是 它 不 一 定 是 
最 短 的 路 径 方案 。 
下 面 是 回溯 产生 答案 的 步骤 序列 : 


Boston 


Albany 
(死胡同 ; 回溯 到 Boston ) 
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Boston 
Pt 


Albany (死胡同 : 回溯 到 Boston) 


Albany ` Hartford New York 
Harrisburg 


Philadelphia 
(死胡同 ; 回调 到 Harrisburg ) 


Albany Hartford New York 
Harrisburg 
Philadelphia Washington 
(成 功 ! ) 


第 4 章 中 介绍 的 框架 提供 了 BackTrack 类 以 及 Application 头 。Position 类 又 怎样 昵 ? 这 个 类 必 
须 进 行 修改 :“ 行 ”和 “ 列 ” 这 样 的 术语 在 网 络 里 是 没有 意义 的 。 细 节 在 编程 项 目 14.2 中 讨论 。 


总 结 


Woh 


无 向 图 由 称 作 项 点 的 项 和 不 同 的 称 作 边 的 无 序 顶 点 对 组 成 。 如 果 对 是 有 序 的 ， 那 么 就 得 到 一 
个 有 向 图 。 树 ， 有 时 称 作 有 向 树 ， 是 一 个 有 向 图 ， 它 或 者 为 空 或 者 包含 一 项 ， 称 作 根 项 ， 使 得 : 

1) 没有 边 进入 根 项 。 

2) 每 个 非 根 项 上 恰好 有 一 条 边 进入 它 。 

3) 从 根 项 到 每 个 其 他 项 之 间 有 一 条 路 径 。 

网 络 (或 无 向 网 络 ) 是 一 个 有 向 图 (或 无 向 图 )， 其 中 每 条 边 有 一 个 关联 非 负 整 数 ， 这 些 
非 负 整 数 称 作 这 条 边 的 权 值 。 网 络 也 被 称 作 是 带 权 图 。 

一 些 重要 的 图 和 网 络 算法 有 : 

1) 从 一 个 给 定 顶点 可 达 的 所 有 顶点 的 广度 优先 选 代 。 

2) 从 一 个 给 定 项 点 可 达 的 所 有 顶点 的 深度 优先 迭代 。 

3) 判断 一 个 给 定 图 是 否 连通 ， 也 就 是 对 任意 两 个 顶点 ， 从 第 一 个 顶点 到 第 二 个 顶点 间 是 
否 有 一 条 路 径 。 


i i 








484 $B14* 


4) 寻找 网 络 的 最 小 生成 树 。 

5) 寻找 网 络 中 两 个 顶点 闻 的 最 短路 径 。 

network 类 的 一 种 可 行 的 设计 和 实现 是 在 map 容 器 里 将 每 个 顶点 和 它 的 邻 大 相关 联 。 具 体 
地 说 ，adjacency_map 是 一 个 map 容 器 ， 其 中 每 个 键 是 一 个 顶点 v， 它 被 映射 到 顶点 - 权 值 对 
<w, Weight> 和 的 链表 ， 其 中 weight 是 边 <v, w> 的 权 值 。 

另 一 种 设计 和 实现 是 将 权 值 存储 在 Y 行 Y 列 的 二 维 数组 里 ， Rp Vie TALS BE 比如 ， 连 
Te Tot ES CRURA BS BUR H TF f CE adjacency, matrix[i][j] P. 

— pd £8 [3] a «p Lai sk ARR. He 8 — 1 E E A PC IK PORE TL — BLA i 
表 〈 由 给 定 顶 点 的 相 邻 边 组 成 )。 


习题 
14.1 a. piti P i fJ Zo fed ES: 
顶点 : A, B, C, D, E 
| 3l: (A,B), (C,D), (D,A), (B,D), (B,E) 
14.2 a. 画 出 包含 四 个 顶点 以 及 尽 可 能 多 的 边 的 无 向 图 。 图 中 将 包含 多 少 条 边 ? 
b. 画 出 包含 五 个 顶点 以 及 尽 可 能 多 的 边 的 无 向 图 。 图 中 将 包含 多 少 条 边 ? 
c.V 个 顶点 的 无 向 图 中 边 的 最 大 数量 是 多 少 ? 
.证 明 (c) 小 题 中 得 出 的 结论 。 
提示 对 V 进 行 数学 归纳 。 


e.V 个 顶点 的 有 向 图 中 边 的 最 大 数量 是 多 少 ? 


CL 


14.3 假设 有 下 面 的 无 向 图 : 
B 
A —— C—— E 
D 
TTL S Ae Pc PR F RENSU 8 A, B ri 


a. 从 A 开始 执行 无 向 图 的 广度 优先 迭代 。 
b. 从 A 开始 执行 无 向 图 的 深度 优先 迭代 。 

14.4 对 给 定 网 络 ， 使 用 最 笨 的 方法 求 出 从 4 到 有 H 的 最 短路 径 ; 也 就 是 说 ， 列 出 所 有 的 路 径 ， 
然后 检测 哪 一 条 的 权 值 最 小 。 


B. HPA > 





14.5 对 习题 14.4 给 出 的 网 络 ， 使 用 Dijkstra 的 算法 (在 get_shortest_path 方 法 中 ) FEMA 
Bl) HE) Be FER FE 

14.6 Prim 的 算法 (get minimum, spanning tree) 和 Dijkstra 的 算法 (get shortest path) 是 
贪心 的 : 局 部 最 优选 择 的 优先 级 最 高 。 在 这 些 情况 下 ， 如 果 局 部 最 优选 择 产生 全 局 [eu 
最 优选 择 ， 那 么 贪心 成 功 。 是 否 所 有 的 贪心 算法 在 所 有 输入 下 都 是 成 功 的 呢 ? 本 题 
中 将 探讨 一 个 换 硬币 算法 。 在 一 种 情况 下 ， 贪 心算 法 对 所 有 输入 都 是 成 功 的。 在 嚼 
一 种 情况 下 ， 贪 心算 法 对 某 些 输入 是 成 功 的 ， 而 对 其 他 一 些 输入 则 是 失败 的 。 

假设 想 使 用 尽 可 能 少 的 硬币 兑换 金额 少 于 一 美圆 的 零钱 。 因 为 越 少 越 好 ， 所 以 

在 每 一 步 上 的 贪心 ( 即 局 部 最 优 ) 选择 都 是 增加 后 不 会 超过 原始 金额 的 数值 最 大 的 
硬币 。 下 面 是 贪心 算法 : | 
// 前 置 条 件 : O<=amount<=99 
/后 置 条 件 : 输出 amount 兑 换 的 零钱 ， 要 求 硬币 尽 可 能 少 。 


void print_fewest (int amount) 
{ 
int coin[ ] = (25, 10, 5, 1}; 
const string RESULT = 
“With as few coins as possible, here is the change for "; 
cout << RESULT << amount << ":": 
for (int i = 0; i< 4; i++> 
while (coin [i] <= amount) 
{ 
cout << coin [i] << endl: 
amount —= coin [i]; 
) // while 
) // print. fewest 


例如 ， 假 设 amount 的 值 是 62。 那 么 输出 将 是 

25 

25 

10 

| 

1 

5 就 是 将 62 分 转换 成 25 分 、5 分 、 一 角 和 一 分 所 需要 的 最 少 硬币 数 。 

a. 证 明 这 个 算法 对 任何 0 到 99 分 (包括 99) 之 间 的 金额 都 是 最 优 的 。 

b. 举例 说 明 ， 如 果 不 能 使 用 5 分 ， ME BIRR BUR A ABE BRAY 也 就 
是 ， 如 果 有 


int coins[J={25,10,1}; 
for(int i=0;i<3 i++) 


那么 算法 对 某 些 输入 而 言 将 不 是 最 优 的 。 
14.7 忽略 习题 14.4 的 图 中 箭头 的 方向 ， 那 么 该 图 就 描述 了 一 个 无 向 网 络 。 使 用 Prim 的 算 
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法 寻找 这 个 无 向 网 络 的 最 小 生成 树 。 

14.8 忽略 习题 14.4 的 图 中 箭头 的 方向 ， 并 假设 图 中 所 有 的 权 值 都 是 1.0。 使 用 Dijkstra 的 算 
法 寻找 从 4 到 五 的 最 短路 径 。 

14.9 修改 Dijkstra 的 算法 ， 寻 找 一 个 给 定 顶 点 v 到 网 络 中 其 他 所 有 顶点 的 最 短路 径 。 

14.10 从 network 类 的 邻接 表 设 计 着 手 ， 定 义 undirected_network 类 中 的 erase_edge 方 法 。 

14.11 4n [E FA SBF TL 了 undirected_network 类 ， 那 么 该 矩阵 将 具有 什么 有 趣 的 特点 ? 

14.12 给 出 方法 的 具体 示例 ， 说 明 当 到 和 VY 成 线性 关系 时 ，network 的 邻接 表 设 计 要 快 于 邻 
HAB Wi. 

14.13 给 出 方法 的 具体 示例 ， 说 明 当 天 和 V 成 平方 关系 时 ，network 的 邻接 表 设 计 要 慢 于 邻 
接 和 矩阵 设计 。 

14.14 如 打 V 很 大 ， 比 如 大 于 10 000， 而 且 E 和 V 成 线性 关系 ， 那 么 network 类 的 哪 种 设计 更 好 ? 

14.15 network 类 的 邻接 惩 阵 设计 的 主要 缺陷 是 什么 ? 

14.16 重新 安排 图 14-29 中 的 边 ， 使 得 回 蛮 产生 的 路 径 与 提供 的 路 径 不 同 。 

14.17 在 网 络 类 的 邻接 表 设 计 中 不 需要 定义 一 个 析 构 器 。 为 什么 ?邻接 矩阵 设计 是 否 需要 
定义 一 个 析 构 器 ? 解释 原因 。 


编程 项 目 14.1: 完成 邻接 和 矩阵 的 实现 


完成 使 用 邻接 矩阵 设计 的 network 类 的 实现 。 下 面 是 缺 省 构造 器 的 定义 : 


network( ) 
{ 
const unsigned v = 100; 
vertices.resize (v); 
adjacency matrix.resize (v); 
for (unsigned i = 0; i < v; i++) 
[ 
adjacency. matrix(i].resize(v); 
for (unsigned j = 0; j < v; j++) 
adjacency_matrix{i][j} = —1.0: 
358 ETI 
next = 0; 
}V 缺 省 构造 器 


根据 你 的 实现 和 习题 14.12 到 14.15 ， 对 network 类 的 邻接 表 设 计 和 adjacency_matrix 设 计 作 


出 全 面 的 比较 。 
SRTR.: BNNH—À RE 


给 出 一 个 网 络 ， 其 中 每 个 顶点 是 一 个 城市 ， 每 条 边 代表 两 个 城市 间 的 距离 ， 求 出 从 一 个 


出 发 点 到 终点 城市 的 路 径 ， 其 中 它 的 每 条 边 的 距离 都 小 于 前 一 条 边 的 距离 。 


分 析 
每 个 城市 都 将 以 至 多 14 个 字符 的 字符 串 表示 ， 且 没有 内 入 的 空格 。 输入 的 第 一 行将 包含 


出 发 城市 和 终点 城市 。 后 面 的 每 一 行 到 终止 符号 “***” 前 ， 将 由 两 个 城市 和 这 两 个 中 第 一 个 
城市 到 第 二 个 城市 的 距离 (以 英里 为 单位 ) 组 成 。 


不 需要 输入 编辑 工作 。 最 早 的 输出 将 是 网 络 。 如 果 没 有 答案 ， 那 么 最 后 的 输出 将 是 




















B). tte P) i 


There is no solution. 
合 则 ， 基 后 的 输出 将 是 
There is solution: 


后 面 跟着 答案 中 的 相应 边 《 出 发 城市 ， 到 达 城 市 ， 距 离 )。 
系统 测试 1 (输入 用 黑体 表示 ) 


in the Input line, please enter the start and finish cities, separated by a blank. Each city 
name should have no blanks and be at most 14 characters in length. 
Boston Washington 


In the Input line, please enter two cities and their distance; the sentinel is “** 
Boston NewYork 214 


In the input line, please enter two cities and their distance; the sentinel is *** 
Boston Trenton 279 


In the Input line, please enter two cities and their distance; the sentinel is *** 
Harrisburg Washington 123 


In the Input line, please enter two cities and their distance; the sentinel is *** 
NewYork Harrisburg 168 


In the input line, please enter two cities and their distance; the sentinel is *** 
NewYork Washington 232 


In the Input line, please enter two cities and their distance; the sentinel is *** 
Trenton Washington 178 


In the Input line, please enter two cities and their distance; the sentinel is *** 


wkk 


The initial state is as follows: 
Trenton Washington 178.0 
NewYork Harrisburg 168.0 
NewYork Washington 232.0 
Harrisburg Washington 123.0 
Boston NewYork 214.0 
Boston Trenton 279.0 


A solution has been found: 


FROM CITY TO CITY DISTANCE 
Boston NewYork 214.0 
NewYork Harrisburg 168.0 
Harrisburg Washington 123.0 


Please close this window when you are ready. 


系统 测试 2 (输入 用 黑体 表示 ) 


In the Input line, please enter the start and finish cities, separated by a blank. Each city 
name should have no blanks and be at most 14 characters in length. 
Boston Washington 


In the Input line, please enter two cities and their distance; the sentinel is *** 
Boston Trenton 279 
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in the Input line, please enter two cities and their distance; the sentinel is *** 
Boston NewYork 214 


In the Input line, please enter two cities and their distance; the sentinel is *** 
Harrisburg Washington 123 


In the input tine, please enter two cities and their distance; the sentinel is *** 
NewYork Harrisburg 168 


In the Input line, please enter two cities and their distance; the sentinel is *** 
NewYork Washington 232 


In the Input line, please enter two cities and their distance; the sentinel is *** 
Trenton Washington 178 


In the Input line, please enter two cities and a weight; the sentinel is *** 
The initial state is as follows: 

Trenton Washington 178.0 

NewYork Harrisburg 168.0 

NewYork Washington 232.0 

Harrisburg Washington 123.0 

Boston Trenton 279.0 

Boston NewYork 214.0 


A solution has been found: 


FROM CITY TO CITY DISTANCE 
Boston Trenton 279.0 
Trenton Washington 178.0 


Please close this window when you are ready. 


注意 系统 测试 2 的 答案 和 系统 测试 1 的 答案 不 同 ， 这 是 因为 在 系统 测试 2 中 ，Boston- 
Trenton 边 是 在 Boston-New York 边 之 前 输入 的 。 








附录 1 WSS 


A1.1 简介 


数学 是 人 类 脑力 劳动 的 突出 成 就 之 一 。 它 对 客观 现象 提供 的 抽象 模型 推动 了 科学 和 工程 
技术 在 每 一 个 领域 的 发 展 。 大 部 分 计算 机 科学 都 是 基于 数学 的 ， 本 书 也 毫 不 例外 。 本 附 孙 介 
绍 了 书 中 涉及 到 的 数学 概念 。 未 尾 给 出 了 一 些 习 题 ， 读 者 可 以 通过 练习 巩 国学 到 的 知识 。 


A1.2 ”函数 和 序列 


Whitehead 和 Russell (1910) 首先 揭示 了 数学 上 的 一 个 令 人 惊异 的 特征 ， 即 它 只 需要 两 个 
基本 概念 。 其 他 的 每 个 数学 术语 都 可 以 建立 在 简单 的 集合 和 元 素 上 。 例 如 ， 有 序 对 <a, b> 可 以 
定义 为 包含 两 个 元 素 的 集合 : 

<a, b>={a, {a, b}} 
元 素 a 被 称 作 是 有 序 对 的 第 一 成 分 ， 而 被 称 作 是 第 二 成 分 。 
给 定 两 个 集合 4 和 B， 可 以 定义 一 个 从 4 到 8 的 函数 f/， 写 作 : 
. f: A-B 

CEA A Feat <a, D-89986. HrhadkAd S, EB, ifArp e oC XO EEE 
有 序 对 的 第 一 成 分 。 因 此 在 一 个 函数 中 ， 没 有 两 个 有 序 对 的 第 一 成 分 是 相同 的 。 集 合 4 和 8B 被 
分 别称 作 定 义 域 和 值 域 。 

例如 ， 

fr{<-2, 4>, <-1, 1>, <0, 0>, «1, 1>, <2, 4>} 

定义 了 定义 域 为 {~2, 71,0, 1, 2} 及 值 域 为 {0,1,2,4} 的 “平方 ”函数 。 函 数 中 没有 两 个 有 

序 对 的 第 一 成 分 相同 ， 但 是 两 个 有 序 对 可 以 拥有 相同 的 第 二 成 分 。 例 如 ， 对 
«- l1, 1> 和 <], 1> 

具有 相同 的 第 二 成 分 ， 即 1。 

如 果 <a, b> 在 中， 可 以 写作 f(a)=b。 这 给 出 了 一 个 更 为 熟悉 的 关于 函数 /的 描述 。 它 的 定 
义 是 : 

AD=P i 在 -2 到 2 之 间 

函数 的 另 一 个 名 字 是 映射 。 这 是 第 10 章 中 用 到 的 术语 ， 用 来 描述 一 个 容器 ， 其 中 的 每 个 
值 由 一 个 惟一 的 键 成 分 以 及 第 二 成 分 组 成 。 实 际 上 就 是 从 键 到 第 二 成 分 的 函数 ， 这 也 正 是 键 
必须 是 惟一 的 原因 。 

有 限 序列 是 这 样 一 个 国 数 ， 对 某 些 正 整数 上 ( 称 作 序列 长 度 )，i 的 定义 域 是 集合 {0, 1, 2, 
…,k-1}。 例 如 ， 下 面 定义 了 一 个 长 度 为 4 的 有 限 序 列 : 

t(0)-"Karen" 
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t(1)z"Don" 

t(2)-" Mark" 

t(3)-" Courtney" 

因为 每 个 有 限 序 列 的 定义 域 都 是 从 0 开始 的 ， 所 以 通常 定义 域 可 以 是 隐 式 的 ， 写 作 : 


t=""Karen”, "Don", “Mark”, “Courtney” 


A1.3 RMR 
数学 需要 相当 多 的 符号 处 理 。 因 此 ， 简 洁 是 一 个 很 重要 的 因素 。 总 和 的 表示 就 是 - -个 很 
好 的 符号 简化 的 例子 。 将 
Xo HX, HX, + +H, 
写成 
这 个 表达 式 可 以 理解 成 “ 当 i 取 从 0 到 n-1 的 值 时 ，x 的 总 和 ”。 我 们 称 i 为 “计数 下 标 ”"。 一 


个 计数 下 标 对 应 着 for 语 句 中 的 一 个 循环 控制 变量 。 例 如 ， 下 面 的 代码 将 在 sum 中 储存 数组 x 里 
从 0 到 n-1 成 员 的 总 和 : 
sum=0.0; 
for(int i=0;i<n;i++) 
sum+=x[i]; 


当然 ， 字 母 ;没有 任何 特别 的 意义 。 例 如 ， 也 可 以 将 
yas 
作为 


1+1/2+1/3+:…+1/10 
的 简写 形式 。 同样 ， pup 37. 2 m, 


$027) 
就 是 
m2" + (m*-1)2 0*9 十 十 12 
的 简写 形式 。 
另 一 种 简写 形式 是 黑 乘 符号 ， 它 比 累加 符号 出 现 的 频率 低 。 例 如 ， 
J] ark 
是 


a[0]*a[1]*a[2]*a[3]*a[4] 
的 简写 形式 。 








PRR 


A1.4 对 数 


John Napier 是 一 位 苏格兰 男 肿 及 兼职 数学 家 ， 他 在 1614 年 发 表 的 论文 中 首先 描述 了 对 数 。 
从 那 时 起 直到 计算 机 的 发 明 ， 对 数 的 主要 价值 就 是 在 于 处 理 算 术 的 难题 : 它们 使 得 很 大 数字 
的 乘法 《和 除法 ) 可 以 仅 通过 加 法 (和 减法 ) 实现 。 

现今 的 对 数 只 有 很 少 的 计算 应 用 一 一 例如 ， 测 量 地 震 的 里 氏 震 级 。 但 是 正如 第 3~14 章 所 
述 ， 对 数 提供 了 进行 算法 分 析 的 工具 。 

我 们 根据 攻 来 定义 对 数 ， 就 好 像 可 以 根据 减法 定义 加 法 ， 而 除法 又 可 以 根据 乘法 定义 一 
样 。 给 定 一 个 实数 p>1， 称 1 为 基数 。 以 为 基数 的 任意 大 于 0 的 实数 x* 的 对 数 可 以 写成 

log,x 
b-x 

例如 ，log:16=4， 因 为 2*=16。 同 理 ，logo100=2， 因 为 10:=100。 那么 log:64 是 多 少 ? 估算 
10g 64. 

Xs 2 OH BY BE SLA ET WE PA: HER RAHI LE XE 
正 实数 x 和 y， 有 

1) log,1=0 

2) log,b=1 

3) log,(xy)=log,x + log,y 

4) log,(x/y)=log,x — log,y 

5) log,b* = x 

6) beer = x 

7) log, = ylog.x 

根据 这 些 等 式 ， 可 以 获得 基数 转换 的 公式 。 对 任意 大 于 1 的 基数 a 和 b 以 及 任意 x>0， 

log,x = log,a*te (根据 性 质 5) 
= (log.x)(log,a) (根据 性 质 7) 

基数 e( 2.718) 在 微 积 分 学 中 有 重要 的 意义 ; 因此 ， 以 e 为 基数 的 对 数 被 称 作 是 自然 对 
数 ， 并 用 ln 替代 了 log.。 | 

要 将 一 个 自然 对 数 转 换 成 以 2 为 基数 的 对 数 ， 可 以 应 用 基数 转换 公式 。 对 任意 x>0， 

Inx=(log,x)(In2) 
两 边 同 除 以 In2， 得 到 | 
log,x=Inx/In2 

假设 预先 确定 了 函数 lIn， 那 么 这 个 等 式 就 可 以 用 于 logx 的 近似 。 

函数 In 和 它 的 逆 exp 使 得 我 们 可 以 执行 短 运 算 。 例 如 ， 假 设想 计算 xw*， 其 中 x 和 y 都 是 实数 
H0. FER Sv: 

w= em (根据 性 质 6) 
-e" (根据 性 质 7) 
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在 C++ 中 ， 这 最 后 一 个 表达 式 可 以 重 写 为 : 
exp(y*log(x)) 
exp 和 log 在 <cmath> 中 进行 了 定义 。 


A1.5 数学 归纳 
对 数 分 析 中 的 很 多 声明 也 可 以 解释 成 整数 的 性 质 。 例 如 ， 对 任意 正 整 数 n， 
Yi=n(n+D/2 


在 这 样 的 情况 下 ， 可 以 使 用 数学 归纳 法 证 明 结 论 。 


数学 归纳 原理 令 51, 5$,，... 是 一 系列 命题 。 如 果 同 时 满足 下 面 两 个 条 件 ， 
1) SJE. 


2) AE SES En, SS AK, MS. HR. 
那么 对 任意 正 整 数 n， 命题 $, 为 真 。 





为 了 帮助 读者 理解 这 个 原理 的 意义 ,假设 51, 5,, ... 是 一 系列 命题 ， 并 满足 条 件 1 和 条 件 2。 
根据 条 件 2， 因 为 5 为 真 ， 所 以 5; 必 定 为 真 。 再 次 应 用 条 件 2， 因 为 5, 为 真 ， 所 以 5; 必 定 为 真 。 
从 此 不 断 使 用 条 件 2， 可 以 断定 5 为 真 ， 然 后 5; 为 真 ， 等 等 。 这 说 明 原 理 中 的 结论 是 合理 的 。 

要 使 用 数学 归纳 来 证 明 一 个 声明 ， 首 先 需 要 将 声明 描述 成 一 系列 命题 5,, SS. .的 形式 。 然 
后 证 明 5, 为 真一 -这 称 作 “ 基 础 情况 *"。 最 后 ， 需 要 证 明 条 件 2 一 一 “归纳 情况 ”。 这 个 证 明 的 
框架 如 下 : 令 n 是 任意 正 整 数 并 假设 5, 为 真 。 要 证 明 5,,, 为 真 ， 需 要 将 5,,, 代 回 $,， 也 就 是 假设 条 
件 中 。 证 明 的 剩余 部 分 通常 会 利用 算术 或 代数 。 

例 A1.1 

我 们 将 使 用 数学 归纳 原理 证 明 下 面 的 声明 : 对 任意 正 整 数 ”， 


Yi=n(n+D)/2 

证 明 首先 将 声明 描述 成 一 系列 命题 。 当 n=1, 2, .时 ， 令 9 是 命题 
Y i-nn49/2 

1) 基础 情况 。 
Yi=1=12)/2 

BILLS A | 

2) 归纳 情况 。 令 nn 为 任意 正 整 数 并 假设 5, 为 真 。 也 就 是 ， 
Yisnnt)/2 


需要 证 明 S,,, 为 真 : 
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y i=(n+))(n+2)/2 


1 
i=l 


HA FASS AAAS RES: 前 (za+l) 个 整数 的 总 和 是 前 2 个 整数 的 总 和 加 上 nm+1l1。 即 
S i-Y iens) 
=n(n+1)/2 + (n*1) 因为 假设 5, 为 真 
=n(n+1)/2 + 2(n+1)/2 
=(n(nt+1) +2(n+1))/2 
=(n+2)(n+1)/2 
于 是 推断 5,,1 为 真 ( 只 要 5, 为 真 )、 因 此 ， 根 据 数学 归纳 原理 ， 对 任意 正 整 数 +， 命 题 5， 
为 真 。 
数学 归纳 原理 的 一 个 重要 变形 是 下 列 形式 : 





数学 归纳 原理 一 一 增强 形式 AS, 5;,.…. 是 一 个 命题 序列 。 如 果 满 足下 列 条 件 ， 
SAK. 

2) 对 任意 正 整 数 n， 若 51, Sa.. SAK, WS HK. 

那么 对 任意 正 整 数 n，5, 为 真 。 






这 个 版 本 和 前 一 版 本 的 区 别 在 于 归纳 情况 。 当 希望 证 明 5,,, 为 真 时 ， 可 以 假设 5,, S, uL S, 
为 真 。 
数学 归纳 原理 和 数学 归纳 原理 的 增强 形式 是 等 价 的 。 
在 继续 深入 之 前 ， 先 要 说 服 自 己 确信 这 个 原理 是 合理 的 。 乍 看 起 来 这 个 增强 形式 比 原 版 
本 的 功能 要 强大 得 多 ， 而 实际 上 ， 它 们 是 等 价 的 。 
现在 应 用 数学 归纳 原理 来 得 出 一 个 简单 而 重要 的 结论 。 
例 A1.2 
对 任意 正 整 数 n， 它 可 以 不 断 除 以 2 直到 n=1 的 次 X X floor(log,n), 
HE BAY FE SIE Bn, PDR IB I hk BE floor(log,n): 
while(n>1) 
nzn/2; 
(回忆 一 下 ， 函 数 floor(x) 返 回 < x 的 最 大 整数 。 例 如 ，floor(18) 返 回 18。) 
WEB] 当 n=1,2,... 时 ， 令 1(n) 表 示 循 环 迄 代 次 数 。 当 n=1, 2, ... 时 ， 令 $, 表 示 命 题 : 


t(n) = floor(log,n) 


1) 基本 情况 。 当 m=1 时 ， 循 环 根本 就 不 执行 ， Aliit(n)=0=floor(log.n), ERENS HH. 
2) 归纳 情况 。 令 n 为 任意 正 整数 ， 并 假设 5,, S., 5, 都 是 真 。 需 要 证 明 5,,, 为 真 。 这 分 两 
种 情况 : | 
— RIMB DUAE ne LAETUS, 352. 58 HORIS BD RUE T Qm 2). BREL, 有 
t(n+1) = 1 + t((n+1)/2) 
= 1+floor(log.((n+1)/2)) (根据 归纳 假设 ) 


oN 
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= 1+floor(log,(n+1)-log,(2)) (因为 商 的 对 数 就 等 于 对 数 的 差 ) 
= 1+floor(log.(n+1)— 1) 

= 1«floor(log;(n--1))- 1 

= floor(log,(n+1)) 


AES... RC. 
Fa RR ent ea. 852.58 ARERR AR E T (72). HU. A 


t(n+1) = 1+t(n/2) 
= 1+floor(log,(n/2)) (根据 归纳 假设 ) 
= 1+floor(log,n—log,2) 
= 1+floor(log;n- 1) 
= 1+floor(log.n)-—1 
= floor(log;n) | | 
= floor(log.(n+1)) (因为 log:(n+1) 不 会 契 一 个 整数 ) 


AES... A 


综 上 所 述 ， 根 据 数学 归纳 原理 的 增强 形式 可 知 ， 对 任意 正 整数 上 ，5 ,为 真 。 


A 


看 过 这 个 范例 之 后 ， 注 意 凡 乎 可 以 用 相同 的 形式 证 明 折 半 查 找 的 最 坏 情 况 下 ， 和 迭代 次 数 是 
floor (log,n)+1 


在 数学 归纳 原理 的 原形 式 和 增强 形式 中 ， 基 本 情况 都 是 证 明 $ ,为 真 。 而 对 某 些 情形 ， 可 能 
需要 从 除 1 之 外 的 其 他 整数 开始 证 明 。 例 如 ， 假 设想 证 明 对 任意 n > 4, 


ni>2" 


(注意 对 n=1, 2, 3， 这 个 命题 为 假 )。 那 么 命题 序列 就 是 9%,,，S;:，.…。 基 本 情况 需要 证 明 $， 
为 真 。 

还 有 一 些 情形 下 可 能 有 儿 个 基本 情况 。 例 如 ， 假 设想 证 明 对 任意 正 整数 n，fib(n)<2 

(实验 10 中 定义 的 fib 方 法 ， 计 算 了 斐 波 纳 契 数 。 ) 基本 情况 是 


fib(1)<2' 和 fib(2)<2? 
由 此 观察 可 以 得 到 下 而 的 原理 : 





数学 归纳 原理 一 一 通用 形式 ” 令 K 和 LL 是 任意 正 整 数 并 满足 <L， 令 Si, Shi .是 一 
个 命题 序列 。 如 果 满 足下 面 的 两 个 条 件 ， 

1) Sr, Ska, .… ,SL 为 真 。 

2) FAE En L, €S5,S,,..,5,9 R, HS LHA., 
ABZ RAL EEA RNS K, RMS, HK, 





通用 形式 是 对 增强 形式 的 扩展 ， 它 使 得 命题 序列 可 以 从 任意 整数 (K) 开 始 并 可 以 有 任意 数 
量 的 基本 情况 (Sx, Seay … , S.)。 如 果 K=L=1， 那 么 通用 形式 就 还 原 成 了 增强 形式 。 

例 A1.3 和 Al1.4 使 用 了 数学 归纳 原理 的 通用 形式 来 证 明 有 关 斐 波 纳 契 数 的 结论 ， 

例 A1.3 

证 明 对 任意 正 整 数 n， 


fib(n)<2" 








证 明 对 “=1,2,…， 令 9 代表 命题 
fib(n)«2" 
在 数学 归纳 原理 的 通用 形式 里 ，K=1 表 示 序 列 从 1 开始 ; L=2 表 示 有 两 个 基本 情况 。 
D fib(1)=1<2=2:， 因 此 5 为 真 。fib(2)=1<4=2?:， 因 此 5, 为 真 。 
2) 令 n 为 任意 >2 的 整数 ， 并 假设 51, 5,, .…, 5, 为 真 。 需 要 证 明 5,, 为 真 (也 就 是 ， 
fib(n+1)<2"'), ARGH SEU ARRIE, 
fib(n+1)=fib(n)+fib(n—- 1) n22 
因为 5,， $5, ... , SAA, 所 以 一 定 有 5 和 5, 为 真 。 因此 
fib(n-1)«2"' H fib(n)<2" 


然后 得 到 
fib(n+1) = fib(n)+fib(n- 1) 
« 27427! 
< 242 
— 2m 
因此 fib(n+1) 为 真 。 


综 上 所 述 ， 根 据 数 学 归纳 原理 的 通用 形式 ， 可 以 断定 对 任意 下 整数 4，fib(n)<2"。 
现在 可 以 用 相似 的 方法 证 明 下 面 的 斐 波 纳 契 数 的 下 界 : 

fib(n)>(6/5) | n»3 
提示 利用 数学 归纳 原理 的 通用 形式 ， 令 K=3，L=4。 


现在 已 经 确定 了 斐 波 纳 契 数 的 下 界 和 上 界 ， 读 者 可 能 会 好 奇 这 些 界限 是 否 能 再 改进 。 还 
可 以 做 得 更 好 ! 在 例 Al1.4 中 检验 了 第 "个 辈 波 纳 契 数 的 精确 的 、 封 闭 的 公式 。“ 封 闭 ”的 公式 
是 指 既 不 是 递归 又 不 迭代 的 公式 。 23 


例 A1.4 
1 人 rw Y (1-45 
we 5j 


证 明 对 任意 正 整数 nn， 
在 考虑 证 明之 前 ， 先 计算 几 个 数值 ， 确 信 公 式 能 提供 正确 的 值 。 
WERA 对 n=1,2,..., 令 5, 是 命题 


seg (555 (38) 


4 x-(0-45)/2, y-(-45)/2. tEX 





»_ (+V5) 1424545. 3445 
4 4 2 


X 





=x+1 


ON 
~] 








oo 
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IH] EB, y=y+1, 











现在 进行 证 明 。 
1) 二 -于 -+ 因此 5, 为 真 。 要 证 明 5, 为 真 ， 可 以 按 如 下 方式 进行 : 
1 14-45 1-45 l E m 2 
E E) 55] arme y) 
=(1/45Xx+1-(y+1)) 
=(1/V5)(x-y) 
1 人 I+Vv5 1-45 
~ V5l 2 2 
-]-fib2) (根据 定义 ) 
因此 5, 也 为 真 。 


2) 令 n 为 任意 大 于 1 的 正 整 数 ， 并 假设 5,, 5,,.… , ,为 真 。 需 要 证 明 $,., 为 真 ; 也 就 是 ， 


1 1-5 n+l 1— 45 n+l 
en xl 5 | 45S | 


根据 斐 波 纳 契 数 的 定义 ， 





fib(n+])=fib(n)+fib(n— 1) 
因为 5, 和 5, ,为 真 ， 所 以 有 (使 用 x 和 y) 
fib(n) = (1/-¥5)(x" — y^) 


以 及 
fib(n - 1) = (1/ 45)(x*' — y") 
代 换 进 前 面 的 公式 可 得 : 
fib(n +1) =(1/-V5)(x" +x" — y" — y) 

-(U A5) G1) - y" Gre D) 
=(1/ V5)(x"™ x!  ynty!) 
z(1/A5yx"! — y") 

HAS AH 


综 上 所 述 ， 根 据 数 学 归纳 原理 的 通用 形式 可 知 ， 对 任意 正 整 数 n+，5, 为 真 。 

例 A1.5 提 出 了 非 空 二 叉 树 的 一 个 结论 : 树叶 数量 至 多 是 树 中 项 的 数量 加 1 再 除 以 2。 妇 纳 
是 基于 树 的 高 度 的 ， 因 此 基本 情况 是 针对 单项 的 树 ， 也 就 是 高 度 为 0 的 树 进行 证 明 的 ，。 

例 A1.5 

令 t 是 一 非 空 二 又 树 ， 它 有 leaves() 个 树叶 和 n(D) 个 项 。 证 明 


leaves(t) < nt) +1 
2.0 








证 明 对 k=0,1,2,.….， 令 5 是 命题 ; OS EE SS E DUK HESS OBI, 
n(t)+1 

| 20 

1) Apr EAEO, ABA leaves(HN=n()=1, Alt 


n(t)*tl. 
2.0 


leaves(t) < 


] = leaves(t) < i 


MLAS AR 

2) 令 k 是 任意 20 的 整数 ， 并 假设 56, 5, , 5 为 真 。 需 要 证 明 S,,, 为 真 。 令 ! 是 高 度 为 kt1 的 
非 空 二 又 树 。leftTree(t) 和 rightTree(?) 的 高 度 都 <k， 因 此 它们 都 满足 了 归纳 假设 。 即 ， 
n(leftTree(t)) +1 


] leftTree(t)) < 
eaves(leftTree(t)) 20 


leaves(rightTree(7)) < nirightTree()) + 1 
而 中 的 每 个 树叶 不 是 在 leftTree(D) 中 就 是 在 rightTree(D 中 。 也 就 是 说 ， 
leaves(t) = leaves(leftTree(r)) + leaves(rightTree(r)) 
那么 就 有 
| n(leftTree(r)) +1 4 n(rightTree(t)) + 1 
2.0 2.0 
_ n(leftTree(t)) + n(rightTree(r)) - 12-1 
g 2.0 
ER TART, rH aE SOS JE E leftTree(s) ge fErightTree(r BH, FAYL 
n(t)=n(leftTree(t))+n(rightTree(t))+1 
用 这 个 等 式 的 右边 代 换 左边 的 内 容 ， 前 面 的 不 等 式 就 变 成 了 
n(t)+1 
2.0 


leaves(t) < 


leaves(t) < 


也 就 是 说 ，5i, 为 真 。 
综 上 所 述 ， 根 据 数学 归纳 原理 的 通用 形式 ， 对 任意 非 负 整 数 :，5, 为 真 。 证 明 结 束 。 


A1.6 归纳 和 递归 


归纳 和 递归 很 相似 ， 但 方向 是 不 同 的 。 

归纳 和 递归 很 相似 ， 两 者 都 有 一 些 基 本 情况 同样， 也 都 有 一 般 的 情况 ， 它 们 可 以 简化 
为 更 简单 的 情况 ， 并 最 终 得 到 基本 情况 。 但 是 方向 是 不 同 的 。 使 用 递归 ， 是 从 一 般 情 况 开 始 
并 最 终 简化 得 到 基本 情况 。 使 用 归纳 ， 是 从 基本 情况 开始 ， 并 利用 它 来 开发 一 般 情况 。 

例 A1.6 涉 及 了 开放 地 址 散 列 (第 13 章 ) 的 分 析 ， 它 是 从 一 个 递归 定义 开始 ， 然 后 猜测 出 
一 个 封闭 的 形式 。 

例 A1.6 

开发 函数 E 的 封闭 形式 ， 对 任意 Kk 和 m，0 < kem: 


OO 
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630 E(0yn-1 ”其 中 m>1 
E(k,m)=1+ K E(k-1, m- 1) 其 中 1 «& k«m 
m 
BL 首先 注意 到 


E(1.m) = 14 -- E(0,m —1) 
n 


对 所 有 m> | 
同 理 ， 


2 
EQ,m) 2 1 E(,m-1) 
n 


= 一 一 对 所 有 m>2 
"iH. 


EQ,m) 214 — EQ.m-1) 
m 


= m-2 对 所 有 m>3 
因此 可 以 推测 





E(k,m) = m+! 对 所 有 m 和 和 k，0 < k«m 
m+l—k 


这 个 推测 可 以 归纳 (对 k 或 m) 证 明 。 例 如 ， 如 果 对 k 进 行 归纳 ， 那 么 k=0,1,2,... 时 ， 命 题 5， 
的 序列 是 


E(k,m) = mtl tim, m>k 
mt+l—k 





习题 


A1.1 使 用 数学 归纳 证 明 ， 在 第 4 章 的 汉 诺 塔 游戏 中 ， 对 任意 正 整 数 +， 从 一 个 村 移动 4 个 盘 
子 到 另 一 个 杆 共 需要 2"- 1 次 移动 。 
A12 使 用 数学 归纳 证 明 ， 对 任意 正 整数 ， 
= Y A AY f) 


KPA — PBR, FE—I ERA. 
A1.3 使 用 数学 归纳 证 明 ， 对 任意 正 整 数 n， 





Y G*27)z(n-1*2^ +1 


A1.4 令 m 是 满足 直列 条 件 的 最 小 正 整数 


fib(nj)»nj 
a. 求 出 no。 
b. 使 用 数学 归纳 证 明 ， 对 任意 n> n, 
fib(n)>n? 


A1.5 证明 fib 是 O((14- 45) /2), 
提示 参阅 例 A1.4 中 的 公式 。 注 总 
abs((1—45)/2) «1 


Att, 4n “非常 大 ”时 ， 可 以 忽略 (0—45)/2y . 
A1.6 证 明 对 任意 非 负 整数 nn， 


$2 a2 I 
i=0 
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附录 2 strings 


A2.1 简介 


本 附录 的 目的 是 熟悉 标准 C++ 中 的 string 类 。 一 旦 了 解 了 这 个 类 的 功能 和 简洁 性 ， 相 信 读 
者 将 很 乐意 学 习 它 一 一 特别 是 学 习 过 C 中 的 字符 串 之 后 。 

在 一 个 文件 中 使 用 string 类 必须 包含 下 面 的 两 行 : 

#inctude <string> 

using namespace std; 


这 两 行 都 是 发 送 给 编译 器 的 指令 。 第 一 行 请 求 了 文件 〈 它 是 标准 模板 库 的 一 部 分 )， 它 声 
明 在 当前 文件 中 可 以 访问 string 类 。 第 二 行 说 明了 标准 模板 库 的 标识 符 将 不 使 用 限定 词 std 出 现 
在 当前 文件 中 。 

字符 串 里 的 单个 字符 可 以 通过 它 的 索引 访问 ， 就 像 数组 一 样 。 例 如 ， 如 果 一 个 字符 串 对 
象 s 包 含 “nevermore”， 那 么 sf0] 就 包 信 了 n，s[1] 包 含 e， 等 等 。 不 要 忘记 索引 是 从 0 开始 的 。 

string 类 有 100 多 个 方法 ， 因 此 不 要 指望 能 全 部 记 住 (甚至 是 认识 )。 附 录 A2.2 节 中 包括 了 
最 广泛 使 用 的 方法 的 接 日 和 示例 。 然 后 将 介绍 一 个 简单 的 字符 串 处 理 程序 ， 随 后 是 string 类 的 
典型 实现 的 框架 。 


A2.2 string 类 的 声明 


本 节 分 成 四 部 分 讲述 : 构造 器 ， 运 算 符 ， 非 成 员 函 数 以 及 其 他 方法 。 为 了 增强 易 读 性 ， 
区 分 下 面 的 方法 接口 与 标准 C++ 规范 ， 这 里 使 用 char 代 替 了 charT， 并 用 unsigned int(t#® 
了 size_type。 


A2.2.1 构造 器 


1. /后 置 条 件 : 该 字符 串 为 空 。 
string(); 


A 按 如 下 方式 将 一 个 字符 串 对 象 初始 化 为 空 : 
string s1; 


2. // 后 置 条 件 : 该 字符 串 被 初始 化 为 字符 串 s 的 拷贝 。 


string(const char* s); 

A 可 以 在 一 条 语句 中 定义 并 初始 化 一 个 字符 申 : 
string s2("bed"); 

现在 s2 中 顺序 包含 了 字符 gb、e 和 d。 

注意 本 构造 器 有 一 个 常见 的 等 价 形式 ， 
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string s2="bed"; 


3. // 前 置 条 件 : ena 的 字符 数量 . 
WERE: ASPIRE RRIA M pos R SUA. 并 且 长 度 为 n 和 


// " Size()-pPos 之 间 较 小 者 的 str 的 子 字 符 串 的 拷贝 。 如 果 省 略 第 三 个 变 元 ， 
/l 那么 将 假定 第 三 个 变量 是 最 大 的 无 符号 整数 。 如 果 也 省 略 了 第 二 个 变 元 ， 那 么 第 
// 二 个 变 元 就 取 0， 


string(const string str, unsigned int pos=0, unsigned int n=- 1); 


Bl 假设 定义 如 下 : 


string s3 = "jabberwocky"; 
string $4 (s3), 
s5 (s3, 5, 3); 


那么 s4 包 含 了 “jabberwocky”，s5 包 含 了 “rwo”; 也 就 是 从 索引 5 开始 ， 长 度 为 3 的 s3 的 
子 字符 串 。 

注意 -1 的 二 进 制 表示 全 部 是 由 1 组 成 的 。 当 这 被 解释 成 一 个 unsigned intit, oH 

表示 了 可 能 的 最 大 的 unsigned int。 因 此 当头 中 有 

unsigned int n=- 1 

时 ， 这 实际 是 一 个 有 效 BRA) 的 方式 ， 将 n 的 缺 省 值 设置 成 最 大 的 unsigned int, 
A2.2.2 运算 符 


4. 1/ 后 置 条 件 : 这 个 字符 串 中 包含 了 str 的 拷贝 。 
string& operator=(const string& str); 


例 假设 s2 采 取 和 构造 器 3 的 示例 相同 的 定义 。 然 后 可 以 定义 


string s3=s2; 
现在 s2 和 s3 中 包含 了 相同 的 字符 串 。 改 变 s2 的 值 将 不 会 影响 53 的 值 (反之 亦 然 )}。 例 如 ， 
假设 随后 进行 赋值 
s2-"flower"; // 赋值 运算 符 
现在 s2 中 包含 了 “flower”， 而 s3 中 包含 的 仍旧 是 “bed”。 
注意 ”字符 囊 赋值 语 向 的 右边 可 以 由 一 个 字符 事 常 量 或 一 个 字符 、 一 个 字符 事 组 成 。 
例如 ， 


s2z"start-up"; 
s3='?'; 


5. // 前 置 条 件 : pos< 这 个 字符 串 中 字符 的 数量 。 
// 后 置 条 件 : 返回 对 这 个 字符 串 中 索引 pos 上 字符 的 引用 。 
char& operator[](unsigned int pos); 
例 假设 字符 串 对 象 s2 中 包含 “flower”， 并 编写 
s2[0]='g’; 
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因为 这 个 运算 符 ( 即 索引 运算 符 ) 将 返回 一 个 引用 ， 所 以 这 条 赋值 语句 用 “8 ”替代 了 s3 
的 索引 0 上 的 “f 。 因 此 现在 s2 中 将 包含 “glower 。 


A2.2.3 JER Rw 


xx Je phy Be nf BE Ae: A fo 2S B9 HK 635 
6. /后 置 条 件 : str 被 插入 到 os 中 ， 并 返回 0s。 


ostream& operator<<(ostream& os, const string& str); 


例 假设 有 
string s6="yes", 
s7="no"; 
cout<<s6<<"or"<<s7<<endl: 
输出 将 是 
yes or no 
7. /后 置 条 件 : 跳 过 is 中 所 有 的 空白 字符 (空格 和 行 尾 标志 ) ， 然 后 从 is 中 取出 - 
if 字符 序列 直到 下 一 个 空白 字符 (但 不 包括 } ， 并 将 它 存 入 str。 返 回 is。 


istream& operator>>(istream& is, string& str); 


例 假设 有 
string s, 

t 
cin>>s; 
cin»»t; 


如 果 输 入 字符 流 包含 了 一 个 空 行 ， 随 后 是 
This was the next line. 


那么 s 中 将 包含 “this” 而 t 中 将 包含 “was”。 | 
8. /后 置 条 件 ， 从 is 中 取出 直到 行 尾 的 字符 (除了 分 隔 符 “\n” 以 外 ) ， 并 将 其 插入 str， 


/ 然后 返回 is。 

ifstream getline(ifstream& is, string& str); - 
例 假设 有 
String line; 


getline(cin, line); 

那么 输入 中 下 一 行 的 内 容 (不 包含 分 隔 符 ^n') 将 存储 在 line 中 。 

注意 这 个 函数 返回 了 一 个 ifstream 对 象 。 当 到 达 文 件 尾 时 ， 返回 值 是 NULL， 它 和 0 636 
以 及 false 是 等 价 的 。 因 此 可 以 不 断 读 入 文件 my_file， 直 到 到 达 文 件 末尾 : 


while(getline(my_file, line)) 
C | 


9. /后 置 条 件 : 返回 Ihs 和 rhs 结 合 { 即 连接 ) ARDRE, 


String operator+(const string& Ihs, const string& rhs); 





ON 
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fil 假设 有 
string s6="first", 
s7="last", 
s8=s6+57; 
那么 s8 将 包含 “firstiast”， 也 就 是 字符 串 “first” 和 “last” 连 接 组 成 的 字符 串 。 如 果 希 望 
在 S8 中 用 空格 分 隔 S86 和 sS7， 可 以 编写 
string s6="first", 
s7="last", 
s8=S6+" "+87; 


10. /后 置 条 件 : 如 果 Ihs 和 rhs 包 含 相同 序列 的 字符 ， 就 返回 真 。 否 则 ， 返 回 假 。 
bool operator==(const string& Ihs, const string& rhs); 


例 假设 有 


string sa="nevermore"; 
sb="nevermore"; 
cout<<(sa==sb)<<endl; 


输出 将 是 0 一 也 就 是 假 ， 因 为 sb 比 sa 多 一 个 字符 ; 在 sb 尾部 的 空格 是 一 个 字符 。 
11. WG RR: 如 果 Ihs 按 词典 顺序 排 在 rhs 之 后 ， 就 返回 真 。 否 则 ， 返 回 假 . 


bool operator==(const string& Ihs, const string& rhs); 


例 假设 有 


string s1 = "elephant", 
S2 = "mouse"; 


if (s1 < s2) 


cout << ‘\"elephant\" is less than \"mouse\".": 
eise 


cout << "l'elephantV is not less than \"mouse\".": 


因为 在 ASCII 码 序列 中 ，e 位 于 m 之 前 ， 所 以 在 词典 顺序 中 “elephant” 就 排 在 “mouse” 
之 前 。 因 此 输出 将 是 


"elephant" is less than "mouse". 


A2.2.4 既 不 是 构造 器 也 不 是 运算 符 的 方法 


下 面 的 方法 按照 字母 顺序 排列 。 
12. // 后 置 条 件 : 返回 值 是 指向 有 size()+1 个 项 的 数组 的 第 一 个 项 的 指针 ， 其 中 前 
Il size() 个 项 就 等 于 这 个 数组 的 相应 项 ， 而 最 后 一 项 是 一 个 空 字符 ， 


const char* c str(); 
例 在 ofstream (或 ifstream) 类 的 open 方 法 中 ， 第 一 个 变 元 必须 是 代表 文件 名 的 字符 
数组 。 因 此 可 以 将 文件 名 作为 一 个 字符 串 读 入 ， 并 通过 c_str 打 开 文 件 : 


cout<<"Enter the name of the file you want to create:"; 
string out_file_name; 
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cin»»out file name; 
ofstream out file; 
out file.open(out file name.c. str(),ios::out); 


13. WW 前 置 条 件 : pos<= 这 个 字符 串 的 字符 数量 。 
// 后 置 条 件 : 在 这 个 字符 串 中 删除 一 个 子 字符 串 一 一 从 pos 索 引 开 始 、 长 度 为 n 和 


II str.size()-n 中 较 小 者 的 子 字符 串 。 返 回 对 这 个 字符 串 (删除 子 字 符 串 之 后 ) 
J| 的 引用 。 
string& erase(unsigned int pos=0, unsigned int n-- 1); 

Gl 假设 有 


string s-"jabberwocky"; 
s.erase(5,3); 
cout««s««endi; 


那么 就 从 s 中 删除 从 索引 5 开始 长 度 为 3 的 子 字符 种。 因此 输出 将 是 
"jabbecky" 


注意 关于 头 中 的 赋值 语 向 
unsigned int n=- 1 
请 参阅 构造 器 3 中 的 “注意 ”部 分 。 
14. /前 置 条 件 : 迭代 器 位 于 这 个 字符 串 的 某 一 项 上 ， 
/后 置 条 件 : 在 这 次 调用 之 前 位 于 position 位 置 上 的 项 从 这 个 字符 串 里 删除 . 
i 调用 前 索引 >position 的 位 置 上 的 每 个 项 分 别 移动 到 低 一 位 索引 位 置 。 
Jl worstTime(n)# O(n), 
void erase(iterator position); 


注意 这 其 实 和 vector 类 中 一 个 参数 的 erase 方 法 的 接口 相同 。 事 实 上 ，string 类 可 以 看 
作 是 vector<Cchar> 的 一 个 扩展 版 本 。 并 且 ， aR vector X P —4£, string X &jerasezy 
法 也 会 使 删除 点 之 后 的 迭代 器 失效 。 
1S. EER 从 索引 pos 开 始 ， 如 果 str 作 为 这 个 宇 符 串 的 一 个 子 串 出 现 ， 那 么 就 

7 .. BASHA E43 RR PR RMR ESL, SR, 8-1. 

int find(const string& str, unsigned int pos=0) const; 


例 假设 有 


string message="The snow is now on the ground.", 
codez"now"; - 
cout««message.find(code); 


“now” 在 字符 捉 message 中 的 第 一 次 出 现 是 在 索引 5 ( 记 着 是 从 索引 0 开始 )， 因 此 输出 将 是 
| 

假设 将 语句 换 成 

cout<<message.find(code,6); 


寻找 的 字符 串 仍 旧 是 “now”， 但 是 搜索 将 从 索引 6 开始 。 从 该 索引 开始 ， 字 符 串 message 
中 “now” 的 第 一 次 出 现 是 在 索引 12 上 的 子 字符 捉 ， 因此 输出 将 是 


C^ 
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12 

注意 ， 尽 管 搜索 是 在 索引 6 开始 ， 但 是 这 个 索引 是 从 字符 串 开头 算 起 的 。 

最 后 ， 假 设 换 成 

cout<<message.find(code, 14); 

因为 字符 串 message 从 索引 14 之 后 就 没有 “now” 出 现 ， 所 以 输出 将 解释 成 unsigned 
int 项 的 -1 (参阅 构造 器 3 的 “注意 ”部 分 )。 例 如 ， 如 果 unsigned int 项 占据 32 位 ， 那 么 输 

4294967295 

这 并 非 预 期 的 结果 ! 为 了 补救 这 个 状况 ， 将 find 方 法 的 返回 结果 强制 转换 成 一 个 int 项 : 

cout««int(message.fin(code,14)); 

输出 是 

-1 

16. /前 置 条 件 : post<=size() 

// 后 置 条 件 : 字符 捉 str 被 插入 这 个 字符 申 的 索引 pos1 之 前 ， 并 返回 对 这 个 字符 


7 串 的 引用 。 
string& insert(unsigned int pos1, const string& str); 
Gil 假设 有 
string s="bed", 
t="and"; 


cout««s.insert(1 t)e«endl; 
那么 字符 串 t 将 播 和 人 字符 串 s 中 b 和 e 之 间 ，s 将 包含 “banded”。 


17. /前 置 条 件 : 迭代 器 位 于 这 个 宇 符 串 开头 和 尾部 之 间 的 位 置 。 
IH BA x 的 拷贝 放 入 迭代 器 位 于 的 位 置 。 调 用 前 index>=position 的 索引 

H 位 置 上 的 每 个 字符 分 别 被 移动 到 高 一 一 位 的 索引 上 。 返回 位 于 新 播 入 字符 上 的 和 迭 们 
// fa, worstTime(n)J&O(n), 
iterator insert(iterator position, const char X); 


注意 这 个 方法 其 实 和 vector 类 中 西 个 参数 的 insert 方 法 是 相 同 的 。 所 有 插入 ， 点 之 后 的 
RR BHR, 


18. /后 置 条 件 : 返回 这 个 字符 囊 中 的 字符 数量 ， 


unsigned int length() const; 


例 假设 string 对 象 :2 和 s3 的 值 同方 法 16 的 示例 中 一 样 ， 并 编写 
| cout««s2. length()<<"<<s3. length()««endl; 


输出 将 是 
6 3 


注意 string 类 还 有 一 个 size() 方 法 ， 它 和 length() 方 法 是 等 价 的 。 ” 


19. // 后 置 条 件 ， 从 案 引 pos 后 退 搜索 ， 如 果 str 作 为 这 个 字符 串 的 子 串 出 现 ， 那 么 
li 将 返回 str 在 这 个 字符 串 中 最 后 一 次 出 现 的 起 始 位 置 的 索引 。 否 则 ， 返 回 -1， 
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int rfind(const string& str, unsigned int pos-- 1) const; 
例 假设 有 
string code="The snow is now on the ground, | know", 
matchz"now"; 
cout««code.rfind(match)««"* *" 
««code.rfind(match,22) ««"**" 


<<code.rfind(match, 10)<<"**" 
««int(code.rfind(match,3))««endl; 


如 末 从 string 对 象 code 尾 部 开始 ,“now” 最 后 一 次 出 现在 索引 34。 如 果 从 索引 22 开 始 ， 并 
加 code 开 头 搜索 ,那么 “now” 最 后 一 次 出 现在 索引 12。 如 果 从 索引 10 开 始 并 向 开头 搜索 ， 那 
么 “now” 最 后 一 次 出 现在 索引 5。 如 果 从 索引 3 开始 并 向 code 开 头 搜索 ， 那 么 “now” 则 没有 
出 现 。 因 此 输出 是 

34**12**5**-1 

这 个 例子 中 代码 的 最 后 一 行 强制 转换 成 int 的 原因 已 经 在 方法 15 (find 方 法 ) 的 “注意 ” 
部 分 讨论 过 了 。 

20. /前 置 条 件 : pos<=size(); 

Hf NES: 返回 值 是 从 pos 索 引 开 始 、 长 度 为 n 和 size()- pos 中 较 小 者 的 


// 字符 串 的 子 串 。 
string substr(unsigned int pos=0, unsigned int n=- 1) const; 
£6) 假设 有 


string s="fruits and vegetables"; 

cout««s.substr()««endl 
<<s.substr(7)<<endl 
<<s.substr(7,3); 


输出 将 是 

fuits and vegetables 

and vegetables 

and 

注意 本 方法 头 中 的 

unsigned int n=- 1 

请 参阅 构造 器 3 的 “注意 ”部 分 。 
A2.2.5 一 个 字符 串 处 理 程 序 


下 面 的 程序 举例 一 至 说 明了 几 个 字 符 串 方法 。 程序 计算 了 文件 中 某 些 目标 字符 串 的 出 现 
次 数 。 输 入 由 文件 名 和 目标 字符 串 组 成 。 


"include «string» ， 
#include <fstream> 


using namespace std: 
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int maint ) 


{ 
const string INPUT_PROMPT = 


"Please enter the name of the input file: "; 


const string TARGET PROMPT = 
"Please enter the target string: "; 


const string RESULT = | 
"The number of occurrences of the target string is "; 


const string CLOSE WINDOW PROMPT = 
"Please press the Enter key to close this output window."; 


string in file name, 
target, 
line; 

ifstream in file; 


int count = 0, 
pos; 
cout << INPUT PROMPT << endl; 


cin —-in file name; 
in. file.open( in file name.c str( ), ios::in ); 


cout << endl << TARGET PROMPT << endi; 
cin >> target; 


while (getline (in_file, line)) 
{ 
pos = line.find (target); 
while (pos != — 1) 
{ 
count ++; 
line = line.substr (pos + target.length( )); 
pos = line.find (target); 
}// 当 line 中 仍旧 保存 target 的 拷贝 时 
} // 当 文 件 还 保存 更 多 行 时 


cout << endl << RESULT << count << endl: 


cout << endl << endl << CLOSE_WINDOW_PROMPT: 
cin.get( ); 
return 0; 

) // main 


注意 1 ”在 这 个 程序 中 ， 不 需要 将 find 方 法 的 返回 值 强制 转换 成 int 项 ， 因 为 该 值 直接 
AMAT —Aint EE, pos, 


注意 2 能 否 使 用 >> 读 入 每 个 单词 ， 然 后 将 该 单词 和 变量 target 的 内 容 比 较 ? 


string word; 
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while(in_file>>word) 
if(word==target) 


count++; 
这 个 方法 不 会 检测 一 个 单词 内 部 目标 的 出 现 。 例 如 ， 如 果 target 是 “count”， 将 不 会 在 
“uncotintable” 或 “accountant” 中 检测 该 字符 串 。 


A2.3 string 类 的 字段 和 实现 
string 类 的 基础 类 是 basic_string。 实 际 情况 如 下 : 


typedef basic_string<char> string; 


string 类 和 很 多 标准 模板 库 里 的 容器 类 很 相似 。 这 里 是 它们 共有 的 方法 : 


empty, size, insert, erase, find, begin, end, =, ==, != 


string 类 和 vector 类 还 有 一 个 索引 运算 符 operatorfl] 。 事 实 上 ，string 类 的 典型 (简化 ) 设 
计 中 包含 了 三 个 和 vector 字 段 相 对 应 的 字段 : 
char* data;/ 对 应 vector 字 段 start 


unsigned nchars;/ 对 应 vector 字 段 finish 
unsigned capacity;// 对 应 vector 字 段 end_of_storage 


data 宇 段 是 指向 项 类 型 为 char 的 数组 的 指针 。nchars 字 段 保存 了 字符 串 中 当前 的 字符 数量 。 
capacity 字 段 保 存 了 data (指向 的 ) 数组 的 当前 大 小 。 
例如 ， 假 设 开 始 时 是 


string s; 


那么 就 分 配 了 某 个 固定 大 小 (比如 256) 的 数组 。 图 A2-1 显 示 了 内 存 的 相关 特性 。 如 果 接 
着 赋值 


s="yes" 


那么 相关 内 存单 元 的 结果 如 图 A2-2 所 示 。 很 容易 看 出 大 多 数 string 类 的 方法 是 如 何 使 用 这 
绎 字段 实现 的 。 例 如 ， 下 面 是 substr 方 法 的 定义 ， 假 设 一 个 构造 器 返回 一 个 字符 串 指针 (指向 
一 个 字符 数组 ) 以 及 一 个 unsigned int: 
String substr (unsigned pos = 0, unsigned n = - 1) const 
( 
unsigned rlen = n < (length( ) ~ pos) ? n: (length( ) — pos) 
return string (data + pos, rien); 
) // substr 方 法 
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nchars capacity 
0 256 





data 


图 A2-1 一 个 空 字符 串 的 设计 表示 


nchars capacity 
3 . 256 


data 


图 A2-2 三 个 字符 的 字符 串 的 设计 表示 


Af R2 











附录 3 多 m 性 


A3.1 简介 


面 癌 对 象 编 程 有 三 个 基本 特色 : 字段 和 方法 封装 进 一 个 实体 ， 子 类 对 类 的 字段 和 方法 的 
继承 ， 以 及 多 态 性 。 多 态 性 一 一 来 自 希 腊 单 词 的 “多 ”和 “形态 ” ， 是 根据 消息 发 送 者 对 象 的 
运行 时 类 型 而 对 消息 进行 不 同 解释 的 能 力 。 例 如 ， 在 第 1 章 中 ， 创 建 了 一 个 使 用 readInto 方 法 
的 Employee 类 ， 然 后 创建 了 一 个 子 类 HourlyEmployee ， 它 使 用 了 新 版 本 的 readInto 方 法 。C++ 
SHEA PERSE: | 


Employee* empioyeePtr; 
employeePtr = new Employee; 


// employeePtri& fq] Employee% rn Ay —7. xf $& , 
employeePtr -> readlnto( ); 


employeePtr — new HourlyEmployee; 


/ 现在 employeePtr 指 向 HourlyEmployee 类 的 一 个 对 象 …… 
employeePtr -> readinto( ); 


E, employeePtr 指 向 Employee 类 的 一 个 对 象 ， 因此 第 一 条 消息 employeePtr->readInto0) 
将 读 入 一 个 姓名 和 薪水 总 额 。 随 后 ，employeePtr 指 向 HourlyEmployee 类 的 一 个 对 象 ， 因 此 第 
二 条 消息 employeePtr->readInto() 将 读 入 一 个 姓名 、 工作 时 数 和 薪水 额 。 

这 个 简单 的 例子 说 明了 多 态 性 的 一 个 重要 方面 : 





当 发 送 一 个 消息 时 ， 调 用 的 方法 的 版 本 依赖 于 对 象 的 类 型 ， 而 不 是 指针 的 类 型 ， 





明确 地 说 ， 在 这 个 例子 中 ， 调 用 的 readInto 的 版 本 依赖 于 对 象 的 类 型 一 -Employee 或 
HourlyEmployee， 而 不 是 指针 的 类 型 ( 即 指向 Employee 的 指针 )。 


A3.2 多 态 性 的 重要 性 


目前 ， 读 者 可 能 还 不 是 很 信服 。 很 容易 就 可 以 重新 编写 A3.1 节 中 给 出 的 例子 以 避免 多 态 
性 ， 因 此 可 能 会 置疑 多 坊 性 是 否 有 实际 价值 。 答 案 无 疑 是 肯定 的 。 现 在 修改 例子 ， 用 以 说 明 
多 态 性 是 如 何 使 得 有 关 继 承 的 方法 能 够 代码 重用 。 我 们 将 修改 Company 类 中 的 findBestPaid() 
方法 ， 使 得 用 户 可 以 选择 是 求 薪水 最 高 的 雇员 还 是 薪水 最 高 的 计时 雇员 。 特别 是 将 提示 用 户 
答 入 “Employee” 或 “Hourly”， 指 示 下 一 个 输入 行 的 组 成 。 
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// 前 置 条 件 ， 确 定 薪水 总 额 最 高 的 雇员 或 计时 雇员 。 忽 略 重复 值 。 
void Company::findBestPaid( ) 


{ 
string CODE_PROMPT = 
"Enter Employee for Employee input or Hourly for hourly employee: ": 


string EMPLOYEE INPUT = "Employee"; 
string HOURLY EMPLOYEE INPUT = "Hourly"; 
Employee* employeePtr; 
string code; 
cout << end! << CODE PROMPT, 
cin >> code; 
if (code == EMPLOYEE INPUT) 
employeePtr = new Employee; 


else if (code == HOURLY_EMPLOYEE_INPUT) 
employeePtr = new HourlyEmployee; 


while (employeePtr -> readinto( )) 
_ if (employeePtr -> makesMoreThan (bestPaid)) 
bestPaid.getCopyOf (*employeePtr); 
} // findBestPaid 


这 个 代码 的 优美 之 处 在 于 不 需要 重新 编写 while 循 环 ，findBestPaid() 方 法 就 可 以 处 理 雇员 
答 入 或 计时 雇员 输入 。 


A3.3 动态 连接 


A3.2 市 的 代码 提出 了 一 个 问题 C++ 编译 器 是 怎样 为 类 似 employeePtr->readInto0) 的 消息 
产生 相应 的 机 器 码 的 ? 阐述 这 个 问题 的 另 一 种 方式 是 : 当 一 些 信息 在 运行 之 前 不 可 用 时 ， 在 
编译 时 ， 方 法 标识 符 readInto 是 如 何 被 界定 在 当前 版 本 中 的 一 -在 Employee 或 是 
HourlyEmployee 里 ?答案 很 简单 : 连接 不 能 在 编译 时 完成 ， 必 须 延 迟 直 到 运行 时 ! 这 种 延迟 
连接 也 称 作 是 动态 连接 或 是 迟 连 接 。 

万 方法 在 项 目 上 花费 了 运行 时 间 代价 。 至 少 ， 编 译 器 不 能 购 入 一 个 虚 方 法 。 使 用 嵌入 ， 
半数 调用 可 以 用 函数 体 的 代码 赫 换 ; 这 节约 了 运行 时 间 ， 因 为 绕 过 了 通常 函数 调用 的 保存 一 
调用 一 恢复 一 返回 机 制 。 而 且 ， 对 使 用 虚 方 法 的 每 个 类 ， 编 译 器 创建 了 一 个 特殊 的 表 
VTABLE 来 保存 虚 方 法 代码 的 存储 地 址 。 并 且 为 这 样 的 类 的 每 个 对 象 给 定 了 一 个 保 窄 字段 
vpointer， 它 指向 相应 的 YTABLE 地 址 。 下 面 的 图 说 明了 A3.2 节 未 尾 的 示例 中 发 生 的 事件 : 


















employeePtr name grossPay vpointer 

ono (RA < 一 人 一， 

0001 Employee pointers 

。 对象 的 机 to other 

. ae virtual 

M 5) methods 

VTABLE 
(针对 Employee) 

name grossPay hourWorked  payRate vpointer 


1010 (iA 







1101 Hourly- pointers 
* Employee to other 
。 S Virtual 
. Ag) methods 
VTABLE 
(针对 HourlyEmployee) 


在 运行 时 ，employeePtr 将 指向 一 个 Employee 对 象 或 一 个 HourlyEmployee 对 象 ， 并 且 将 调 
用 相应 的 readInto 版 本 。 

对 虚 方法 而 言 ，vpointer 在 运行 时 带 来 的 额外 工作 是 必需 的 ， 但 对 其 他 方法 而 言 是 浪费 时 
间 。 为 了 提高 效率 ， 每 个 虚 方法 必须 用 关键 字 virtual 在 基 类 头 文件 中 进行 声明 。 因 此 
Employee.h 将 有 


virtual bool readinto(); 


这 使 得 编译 器 能 够 对 虚 方 法 支持 迟 连 接 ， 对 非 虚 方法 提供 稍 快 些 的 代码 。 最 后 是 对 基 类 
开发 者 职责 的 影响 ， 即 在 对 应 用 或 子 类 一 无 所 知 时 判定 方法 是 否 应 当 是 虚 方 法 ! 它 的 结果 是 
只 有 当 基 类 版 本 中 有 关键 字 virtual 时 ， 方 法 才 是 虚 的 ， 并 且 重 载 的 运算 符 不 能 是 虚 的 。 因 此 
如 果 不 是 readInto， 而 是 重 载 插入 运算 符 operator>>， 将 不 能 应 用 多 杰 性 。 


C 
下 
oO 
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索引 中 的 页 码 为 英文 原 书 的 页 码 ， 与 书 中 边栏 的 页 码 一 致 。 
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Abstraction( 抽 象 ) 
data (数据 ),6-8 
principle of (+ 的 原理 ),64 
Access (访问 ) 
constant-time (常数 时 间 ),462 
protected,18-20 
random( 随 机 ),163,462 
Activation records (活动 记录 ),145,278 
Active functions (活化 函数 ),144-145 | 
Acyclic undirected graphs (无 环 无 癌 图 ),566 
Adjacency-list design( 邻 接 表 设计 ),592,605 
Adjacency matrix (4246 B4),605 
completing implementation of( 完 全 实现 ),614 
adjustPath method(adjustPath 方 法 ),368-370 
Aggregation (聚合 ),69,71 
Algorithms (算法 ),318-324 
backtracking ([n] 8]),322,575 
binary searching ( 折 半 查找 ),125-135,515-517 
breadthFirst( 广 度 优 先 ),322-324 i 
decimal-to-binary (十 进 制 到 二 进 制 的 转换 ),99-102 
divide and conquer (分 治 法 ),500 
”factorials (BY F€),94-99 
generic jin container classes CERE UEBER S 
graph (图 ),571-587 
greedy (贪心 算法 ),468,611-612 
inOrder (中 序 ),318-320 
maze searching ( 迷 官 搜索 ),152,304-305 
permutations (置换 ),142-144 
postOrder (后 序 ),320-321 
preOrder (前 序 ),321-322 
 run-times for sorting (排序 的 运行 时 间 ),500 i 
sorting (排序 ),501 
Towers of Hanoi (7M i#§#%),103-111 154-156 631 
tree_sort,483-484 
Allocator parameters (Allocator 参 数 ),165 
American National Standards Institute 美国 国家 标准 化 组 
织 ),164 


amortizedTime(n),179-180,197-198 
Ancestor classes (4H 4.28) ,18,368 
Application class (应 用 类 ),114-115 
Applications (应 用 ) 
of AVL trees,a simple spell- checker (AVL 树 的 应 用 ,-- 个 
简单 的 拼写 检查 器 ),380-383,389-390 
of deques,very long integers ( 双 端 队列 的 应 用 ,非常 长 的 
整数 ) ,198 
of hash map class (hash_map 类 的 应 用 ),538-539 
of lists,a line editor, 链表 的 应 用 ,一 个 行 编辑 器 ),228- 
240,244-245 
of priority queues Huffman codes (优先 队列 的 应 用 , 3E X 
曼 编 码 ),456-468 
of recursion,a maze (递归 的 应 用 ,一 个 迷宫 ),117-125 
of sets,spell-checker,revisted (集合 的 应 用 ,又 一 次 构造 拼 
写 检查 器 ),425-431 
of stacks,converting infix to postfix (JE EB Py FH prp £g 
变换 成 后 缀 ),285-295 
of stacks,how recursion is implemented (堆栈 的 应 用 ,递归 
是 如 何 实现 的 ),277-285 
of vectors,high-precision arithmetic (向 量 的 应 用 ,高 精度 
算法 ),184-190 
Arguments template ( 变 元 ,模板 ),44 
Array buckets ( 桶 数组 ),521-522,534 
Arrays (数组 ),41-42 
associative (关联 ),428 
map (映射 ),193 
and pointers (和 指针 ),39-40 
Associative arrays (关联 数组 ),428 
Associative containers (关联 容器 类 ),325 
in the Standard Template Library (在 标准 模板 库 中 ),422- 
425 | 
Automatic type conversion (自动 类 型 转换 ),217 
Average height,of a BinSearchTree ( 折 半 查找 树 的 平均 高 
度 ),345 
averageSpace(n),74 
averageTime(n),74,197,334,342,514 
AVL tree application,a simple spell-checker (AVL BT] |; JH, 
一 个 简单 的 拼写 检查 器 ),380-383 
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AVL trees (AVL#}),353-390 
AVLTree class (AVL Tree2K) 364-367 
balanced binary search trees (平衡 折 半 查找 树 ),354 
correctness of the insert method ( 插 人 方法 的 正确 性 ).377- 
380 
enhancing the SpellChecker project (改进 SpellChecker 项 
H ),389-390 
the erase method in the AVLTree class (AVLTree 类 中 的 
erase Fy 72:),388-389 . 
the fixAfterinsertion method (fixAfterInsertion7; ?3:),367- 
377 
function objects (ER ABE] $2 ),361-364 
height of (…… 的 高 度 )360-361 
rotations (旋转 ),354-358 
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BackTrack class (BackTrack 关 ),113,115 

Backtracking application,a maze ([|Bl B8 JH, — 3K 
8117-125 

Backtracking strategy ( 回 漳 策略 ),322,575 
through a network (通过 网 络 ),615-617 

Balanced binary search trees,in AVL trees (平衡 折 半 查找 树 ， 
AVL 树 ),354 

balanceFactor field (平衡 因子 字段 ),366-375 

Base,of logarithms( 对 数 的 底数 ),622 

Base classes ( 基 类 ),18 | 

Bidirectional iterators (双向 选 代 器 ).206 

Big-O notation (大 0 表示 法 ),166 
getting estimates quickly (快速 估算 ),77.81 
in program implementation (在 程序 的 实现 中 ),74-77 
smallest upper bound in (最 小 上 界 )76 
upper bound in (上 界 ).74.82 

binary search algorithm (binary_search 算 法 ),126-134.1S2 

Binary search trees ( 折 半 查找 树 ),307-351 
the average height of (平均 高 度 ),345 
balanced ,in AVL trees (平衡 的 ,在 AVL 树 中 ),354 
BinSearchTree class (BinSearchTree 类 ),307,325-327 
BinSearchTree iterators (BinSearchTreei® (0%) 342-345 
fields and implementation of (字段 和 实现 ),329-334,350- 
351 
Iterator class for ( 选 代 类 ),327-329 
recursive methods for (递归 方法 )334-342 

Binary searching ( 折 半 查找 ),126.515-517 
iterative in recursion (迭代 的 ,在 递 娄 中 ),134 
in recursion (在 递归 中 ),125-135 

Binary Tree Theorem (二 又 树 定理 ),315-316,345,347- 


348,386 

Binary trees (二 又 树 ) 
binary tree theorem ( — X fhe FB) 314-317 
definition and properties (定义 和 属性 ),.308-324 
external path length (外 部 路 径 长 产 ).317-318 
traversals of (遍历 ),318-324 

Binding dynamic (连接 ,动态 的 ).649-650 

Black-height( 黑 色 高 度 ),397 

Bottom-up testing ( 自 底 向 上 测试 ),72 

Boundary values (边界 值 },71 

Branches (树枝 ),308 

Breadth-first iterators (J RE (t 2635 16 23),571-574 

breadthFirst traversal,level-by-level (J^ RE (X. Jti H3 3 EB 
Hb) 322-324 

Bubble Sort (E if HEF) 505-506 

Buckets (#9) ,524 
array (数组 ),521-522,534 
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C++ language (C++ 语 言 ),164,214,362,422,464 
classes in (C++ 中 的 类 ),1-33 
Calling object (调用 对 象 )3 
Car wash simulation (洗车 处 仿真 ),264-274 
analysis of the CarWash methods (CarWash 方 法 的 分 
析 ),272 
extending (扩展 ),298-300 
implementation of the CarWash class (CarWash 类 的 实 
现 ),268-272 
program design (程序 设计 ),266-268 
randomizing the arrival times (随机 化 到 达 时 间 ),272-274 
Casting,in program implementation (类 型 转换 ， 在 程序 实现 
中 ),86-87 
Chained hashing ( 链 式 散 列 ),524,535-537 
Chaining (链接 ) 
in building a symbol table (在 构造 一 个 符号 表 中 ),561 
in hash classes (在 散 列 类 中 ),522-530 
Chains ( 链 ),316-317 
char (字符 ),186,188,633,644 
casting to int (类 型 转换 成 整 型 ),87 


Children,deleted node with ( 子 节点 ,删除 有 子女 的 节 
点 )410-421 


Class declarations (类 的 声明 ),12,14 

Classes (类 ),1-33。 参 阅 Ancestor classes; Base classes; 
Derived classes; Desendant classes; Subclasses; Superclasses 
Application (fy FA),114-115 
AVL Tree 364-367 
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BackTrack,113,115 
BinSearchTree,325-327 
CarWash,implementation of (CarWash 类 的 实现 ),268-272 
Company,17,68 
constructors for (7 的 构造 器 ),8-10 
container (7 #),42-59 
data abstraction (数据 抽象 ),6-8 
deque ( 双 端 队列 ),192-198 
Editor,232-240 
Employee,10-17 67-70 647-648 
friends in (AC 70).26-27 
hash_map,517-539 
hash_set,540 
HourlyEmployee 20-23 647-648 
Huffman (Æ K ),461-468 
information hiding in (信息 隐藏 ),28 
inheritance in (447&),17-18 23 
instances of (实例 ),2 
Iterator(33; 4t 2$),50-52,113,530-531 
Linked (5£5X),44-48,91 
LinkedDriver 91 
]ist( 链 表 ),205-251 
map (映射 ),427-431 
method interfaces (方法 接口 ),2-3 
multimap {多 映射 ),431 
multiset (多 集合 ),427 
network (网 络 ),588-607 
and objects (和 对 象 ),3-6 
operator overloading in (运算 符 的 重 载 ).2S-26 
overloading operator= and operator >> in ( 重 载 运算 符 = 和 和 
运算 符 >>),27 
priority queue,440-444,454-455 
protected access to (protected jj [5]),18-20 
queue (BA Fil) 255-258 305 
rb_tree,399-408 
Sequence( 序 列 ),33 
set (集合 ),427 
SimpleClass,30-32 
stack (堆栈 ),274-277 
stream ( 流 ),24 
string (%77 ),633-645 
struct (结构 ),1446,123 
value type,537-538 
vector (ja) & ),166-174,177-184 
very long int,185-190 

Clusters (46) 549 

Codomains ( 值 域 ),619 
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Collision handler,quotient-offset (冲突 处 理 器 , 商 偏 移 ),550 
Collisions (冲突 ),521 
command check method (command_check 方 法 ),232,235 
Company class (Company 类 ),17,68 
Company method (Company 方 法 ),17 
Company project (Company 项 目 ),17 
Compare method (compare 方 法 ),383 
Compiler directives (491% #494) ,13 
Complete tree (完全 树 ),312 
Complete undirected graphs (完全 无 向 图 ),564 
Composition (复合 ),69-70 
Computer simulation,with queues (使 用 队列 进行 计算 机 念 
FL) 261-264 
Concordance, building (创建 词汇 索引 让, 437-438 
Conditional operators (条 件 运 算 符 ),183 
Connected graphs (连通 图 ) 
directed (4 {nl ff9),567 
undirected {无 同 航 ),566,578 
Connectedness,in graph algorithms (在 图 算法 中 的 连通 
性 ),578-579 
Constant reference parameters (常量 引用 参数 ),14 
Constant-time access (常数 时 间 访 问 )462 
Constructor headings (构造 器 头 ).216 
constructor-initializer section (构造 器 初始 化 部 分 ),216 
field initializations (字段 初始 化 ),216 
Constructors (构造 器 ),8-10 
copy (#5 01),167 209 
default (ft 1) .9-10,14 
public,51 
in string class (E FFF tB E+) 634-635 
zero-parameter (0-2: &) 9 
Container adaptors (Zt #8 Add 2X) 
circular (528), 260 
in queues(BA FI A AY--- ---),259-260 
stack class as (堆栈 类 作为 ……: 1276-217] 
Container classes (4 25 3&),42-59 
in data structures (数据 结构 中 ),58-59 
defining the other iterator operators (定义 其 他 的 迭代 器 运 
算 符 ),52 
design and implementation of the iterator class (迭代 器 类 
的 设计 与 实现 ),50-52 
destructors ( 析 构 器 ),53-54 
generic algorithms (通用 型 算法 ).54-58 
iterators GE (C 23),48-50 | 
linked structures ($# 7:4 £j) 44-48 
overloading operator- ( 重 载 运算 符 =),54 
pop_front method (pop_front 方 法 ),52-53 
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in the Standard Template Library (在 标准 模板 库 中 ),58-59 
storage structures for (存储 结构 ),44 
Containers ( 安 器 ),42 
associative, in the Standard Template Library (在 标准 模板 
库 里 的 关联 性 )422-425 
vectors compared to other (向 量 与 其 他 容器 的 对 比 ),176- 
177 
Contiguous design for queues (队列 的 连续 设计 ),260-261 
Contract,between developer and user (开发 者 和 用 户 间 的 合 
2:)),8,68 
Conveting infix to postfix application (将 中 级 转换 成 后 级 的 
应 用 ),285-295 
converting from infix to postfix (将 中 组 转换 成 后 组 ),291 
postfix notation (后 级 表示 法 ),286-289 
prefix notation (前 级 表示 法 ),292-295 
tokens (10 5-),290-291 
transition matrix (转换 矩阵 ),289-290 
Copy constructors (Copy 构 造 器 ),167,209 t 
Copy function (Copy ER 9r) ,93 
Corollaries, Vector-Iterator (jn] &-3* € HEY) ,174 
Correctness (正确 性 ) 
of the insert method in AVL trees (AVL 树 中 插入 方法 
的 ……: ),377-380 
in program implementation ,feasibility of (在 程序 实现 中 ， 
Ute 的 可 行 性 ).73 
Cost, of recursion (递归 的 代价 ),145-146 
Cycles (回路 ),566 
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Data Abstraction, principle of (数据 抽象 原理 ),6-8,27-28,48- 
49,82 

Data structures (数据 结构 ) 
in container classes (在 容器 类 中 ),58-59 
implementation of (…… 的 实现 ),59 

Date class (Date3&) 2-7 

Deallocation, of dynamic variables (动态 变量 的 存储 单元 释 
放 ),40-41 v | 

Decimal-to-binary recursion (十 进 制 到 二 进 制 的 递归 转 
换 ),99-102 
Fibonacci numbers (423% 4442.3%),102 

Decision trees (决策 树 ),482 

Declarations (声明 ) 
class (类 ),12,14 
struct (结构 ),14 | 

Decoding a message with priority queues (使 用 优先 队列 解 
Gi E.) 473-475 


Default constructors (if 4 Fi 25 ),9-10,14 
delete command method (delete command 77 #) 236-237 
Deleted node (删除 节点 ) 
a leaf (树叶 ),409-410 
a leaf or with two children (一 个 和 树叶 或 大 有 两 个 子女 的 
节点 )411-421 
with two children (有 两 个 子女 的 节点 ),410-411 
deleteLink method (deleteLink 7; ¥:) 337-341 349 
delete operator (deletejz $$ £F) 40-41 52 
Dense networks (密集 网 1.607 
Dependency diagrams (依赖 关系 图 ),67-71 
Depth (深度 ),311 
Depth-first iterators (R HE X, 7p Xx (6 23),574 
Depth-first search (深度 优先 搜索 ),322 
Deque application, very long integers ( 双 端 队列 的 应 用 ， 非 
常 长 的 整数 ),198 
Deque class (Deque 类 ) 
fields and implementation of (…… 的 字段 和 实现 ),192- 
198 
Hewlett-Packard’s (惠普 的 ),198 
Deque methods, differences between list methods and (Deque 
方法 ， 与 list 方 法 之 间 的 区 别 ).213-214 
Deques ( 双 端 队列 ),163-204 
alternative implementation of (+ 的 另 一 种 实现 ),204 
in the Standard Template Library (在 标准 模板 库 中 ),164 
Dereference-and-select operator ( 脱 引 用 和 选择 运算 符 ),37 
Dereference operator ( 脱 引 用 运算 符 ),37.58 
Derived classes (派生 类 ).18 
Descendant classes (子孙 关 ),18 
Destructors, in container classes (容器 类 中 和 的 析 构 器 ),53-54 
Developer, contract with user (JF A 34 00JH 73 z lal 
25)),8,68 i 
Developmental life cycle, in software engineering (软件 工程 
中 的 开发 生命 周期 )64 
Directed graphs (digraphs) (有 向 图 ),567-568 
connected (连通 的 ).567 
undirected (无 向 的 ),568 
Directed trees (有 问 树 ),568 
Directives( 指 令 ) 
compiler (编译 器 ),13 
using (使 用 ),13-14 
Divide and conquer algorithms (分 治 法 ).S00 
Domains (定义 域 ),619 
Double hashing CX #91) 550-554 
in building a symbol table (在 构造 一 个 符号 表 时 ),561 
Double rotation ( 双 旋 转 ),3$7 386 
Drivers (驱动 器 ).72 
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in program implementation (在 程序 实现 中 ),72 
Dynamic binding (动态 连接 ),649-650 
Dynamic-variable assignments, versus pointer-variable 
assignments (动态 变量 赋值 与 指针 变量 赋值 对 比 ),40 
Dynamic variables (动态 变量 ),36 
deallocation of (------ 的 存储 单元 释放 ),40-41 
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Edge-related methods, implementation of (Edge-related7; i: 
的 实现 ),594-596 
Edges (34),563-568 
Editor class (Editor2&) 
design of (…… 的 设计 ),232-234 
extending (扩展 ),244-251 
implementation of (----+- 的 实现 ),234-240 
Ffficiency of methods, estimating, in program (程序 中 方法 的 
效率 的 估算 ) 
implementation (实现 ).74 
Eight-queens problem ( 八 皇 后 问题 ),156-158 
Element, 619 
Employee class (Employee 类 ),10-17,67-70,647-648 
definition of (…… 的 定义 ),15-17 
Encoding (编码 ) | 
Huffman (7X #),457 
prefix-free (无 前 组 ),456 
equalTo method (equalTo 方 法 ).29 
erase method (erase 方 法 ),349 
in the AVI Tree class (在 AVLTree 类 中 ).388-389 
in hash classes (在 散 列 类 中 ),543-548 
erase method in red-black trees ( 红 黑 树 中 的 erase 方 法 ),408- 
421 
if the deleted node had two children (如 果 被 吊 除 的 节点 有 
两 个 子女 )410-411 
if the deleted node was a leaf Gn 果 补 届 除 的 节点 是 一个 
树叶 ),409-410 
if the deleted node was a leaf or had two children Cin Ro M 
除 的 节点 是 一 个 树叶 或 有 两 个 子女 ),411-421 
Evaluating a condition, with queues (使 用 队列 求 条 件 的 
值 ),300-304 
Event-driven simulations (事件 驱动 仿真 ),266 
Execution frames (执行 结构 框架 ) 
for factorials (RH ),96-99 
in recursion (递归 的 …… ),96-99 
explicit,255 
Exponential-time method (指数 级 时 间 方 法 ),80 
External path length, in binary trees (二 叉 树 的 外 部 路 径 长 


度 ),317-318 
External Path Length Theorem (外 部 路 径 长 度 定 理 ),345,483 
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Factorials (阶乘 ).94-99 
execution frames for (+> 的 执行 结构 框架 ),96-99 
in recursion {递归 和 的 ……),94-99 
Stirling's approximation of (……: 的 Stirling 的 近似 值 ),453 
Fairness, incorporating in priority queues (优先 队列 的 公平 
合并 ),454 
Fast sorts (快速 排序 ),483-500 
Feedback (反馈 },263 


Fibonacci numbers (4278 4432 8%) ,627-628 


in recursion (在 递归 中 ),102 
Fibonacci tree (3E7E 4432) ,360 
Field initializations, in constructor headings (构造 器 头 中 字 
段 的 初始 化 )216 
Fields (字段 ),2 
balanceFactor (平衡 因子 ),366-375 
in the BinSearchTree class (在 BinSearchTree 类 中 ),329-334 
in the deque class (在 双 端 队列 类 中 ),192-198 
different forms of (+ 的 不 同形 式 ),6-7 
in the hash. map class (在 hash_map 类 中 ),519 
in the iterator class, 530-531 
in the list class (在 链表 类 中 ).214-221 
in the network class (在 网 络 类 中 ),591-593 
object (对 象 ),9 
in the priority_queue class (在 priority_queue 类 中 ) 443-444 
private ,15,18-19,423 
in program design (在 程序 设计 中 ),67 
protected ,26 
public,26 | 
of the vector class, possible ( 向 量 类 的 可 能 的 字段 ).177 
FIFO ( 先 人 先 出 )。 参 阅 First in, first out 
Files (文件 ) 
header ( 头 文件 ),12 
Sorting (排序 ),509-511 
source (ii 3¢ #F),15 
find method (find Fy 2::),351 
Finite sequences (44 BR FF FJ) 620 
First component (第 一 组 件 ),619 
First in, first out(FIFO), 254 
fixAfterInsertion method, in AVL trees (AVL 树 中 的 
fixA fterInsertion Jy 7?) ,367-377 
float (77 51) 25 
Forward-iterators (Ail Fa 3K f 28),176 
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Friends, in classes (类 的 友 元 ),26-28,539 
Full tree (355 59),311 
Function objects(functors),in AVL trees (AVL 树 中 的 函数 对 
象 ( 国 子 ).361-364 
Functions( 国 数 ),.619 
active (活化 ),144-145 
mathematical (数学 的 ),619-620 
recursive (递归 的 ),145 
Functors( FA $). #/%]Function objects 


G 


Garbage (无 用 单元 ),40 
generatelnitialState method (generatelInitialState 77 ?&),116 
Generating minimum spanning trees, with graph algorithms 
(利用 图 算法 求 最 小 生成 树 ),579-584 
Generating permutations (生成 置换 ),135-144 
estimating time and space requirements (估算 时 间 代 价 和 
存储 代价 ),142-144 
in recursion {递归 地 :…… ),135-144 
Generic algorithms, in container classes (容器 类 的 通用 型 算 
法 ),54-58 | 
getCopyOf method (getCopyOf7j 23:).11,14,23 
getlinefunction, 238 
get minimum, spanning tree method (get. minimum spanning - 
tree Fy #£),599-601 
get shortest path method (get_shortest_path7; #:),601-603 
Global methods, implementation of (全 局 方法 的 实现 ),396- 
599 | 
Graph algorithms (图 算法 ).571-S87 
connectedness in (连通 性 ),578-579 
finding the shortest path through a network (在 网 络 中 寻找 
ie 5B) 584-587 
generating a minimum spanning tree (生成 一 个 最 小 生成 
树 ),579-584 
iterators in (440 23),571-578 
Graphs (图 ),563-617 " 
and backtracking through a network (和 网 络 中 的 回 
880)),607-610,615-617 
completing the adjacency-matrix implementation (完成 邻 
PE HERE) 614 (| | 
directed (有 向 的 ),567-568 | 
and trees (和 树 ),568-569 
undirected (无 向 的 ),564-566 
weighted ( 带 权 的 ).569 
Greedy algorithms (贪心 算法 ),468,611-612 
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Hash classes( 散 列 类 )。 参 阅 open-address hashing 


applications of (…… 的 应 用 ),538-539 
chaining ( 链 式 ),522-530 
double hashing ( 双 散 列 ),550-554 
erase method (erase 方 法 ),543-548 
fields and implementation of the iterator class (Z Et & Hik 
代 器 类 的 实现 ),530-531 
primary clustering ( 主 聚 类 ),549-550 
run-time comparison of chaining and double hashing in 
building a symbol table (通过 构造 一 个 符号 表 , 比 较 链 式 
和 双 散 列 的 运行 时 间 ),561 
the value_type class (value_type 类 ),537-538 
Hashing ( 散 列 ),519-522 
chained, analysis of (分 析 链 式 散 列 ),535-537 
hash, map class (hash_map 类 ),517-539 
analysis of chained hashing (分 析 链 式 散 列 ),535-537 
fields in (^^: 中 的 字段 ) 519 
implementation of (…… 的 实现 ),532-535 
timing (计时 ),539 
hash set class (hash_set 类 ),540 
Header files ( 头 文件 ),12 
Header node ( 头 节 点 ),215 
Heap Sort ( 堆 排 序 ),485-487 
analysis of (------ 的 分 析 ),486-487 
example of (…… 的 示例 ),485-486 
Heaps ( 堆 ),36,444-454 
versus stacks (和 堆栈 比较 ),37-38 
Height (高 度 ) 
of an AVL tree (AVL 树 的 ……),360-361 
of a BinSearchTree ( 折 半 查找 树 的 ……),310,.345 
of a red-black tree ( 红 黑 树 的 …… ),394-399 
Helper methods (辅助 方法 ),189 
Hewlett-Packard & 1$ 83) 
deque class ( 双 端 队列 类 ),198 
rb tree class (rb_tree 关 ), 399 
Hiding information (信息 隐藏 ).28 
High-precision arithmetic (高 精度 算法 ),184-190 
design of the very long int class (very_long_int 类 的 设 
tt),185-187 
expanding the very. long int class (P févery_long_int 
类 ),190 
implementation of the very_long_int class (very_long_int 
类 的 实现 ),187-190 | 
hint iterators (18 2r:33: (C 28),431 
Holes (f&BF),446 
HourlyEmployee class (HourlyEmployee?8&),20-23,647-648 
Huffman codes application ( 霍 夫 上 党 编码 的 应 用 ),456-468 
design of the huffman class (huffman 类 的 设计 ),461-463 
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implementation of the huffman class (huffman 类 的 实 
H ),463-468 

Huffman encoding (Æ X: & #m4),457 

Huffman trees (Æ 3 #4),458 


Implementation (实现 ) 
of the BinSearchTree class (BinSearchTree 类 的 :…… ),329- 
334 350-351 
of data structures (数据 结构 的 .…… ),59 
of the deque class ( 双 端 队列 类 的 …… ),192-198 
of deques ( 双 端 队列 的 …… ),204 
of the hash, map class (hash_map 类 的 …… ),532-535 
of the iterator class (和 迭代 器 类 的 ……),530-531 
of the iterator class in container classes (容器 类 中 的 迭代 
ae RA ),50-52 
of the list class (链表 类 的 …… ),214-221 
of the network class( 网 络 类 的 …….),593-594 
of the priority, queue class (优先 队列 类 和 的 ……),443- 
444 454-455 
of recursion (递归 的 …… ),277-285 
of the string class (ETT 8B 2& B ------),644-645 
of the vector class (向 量 类 的 ……- ),177-184 
Incorrect versions (错误 版 本 ),147-148 
Increment operator ( 增 量 运算 符 ).$8 
Indirect recursion (间接 递归 ),144-145 
Induction, mathematical (数学 归纳 法 ),623-631 
Infinite recursion (无 穷 递 归 ),96 — 
Infix, converting to postfix (中 组 转换 成 后 缀 ),291 
Information hiding {信息 隐藏 ),28 
Inheritance (继承 ),17-18,23 
multiple (多 重 ),24 
Inlining (RR À.),649 
inOrder traversal, left-root-right ( 左 - 根 - 右 ， 中 序 遍 历 ),318- 
320,325 | | : 
Insertion Sort (插入 排序 ),478-481 
analysis of (……: 的 分 析 ),481 
example of (+++ 的 示例 ),480-481 
Insert method (插入 方法 ) 
in AVL trees, correctness of (在 AVL 树 中 的 正确 性 ),377- 
380 
in rb tree class (在 rb_tree 类 中 ),399-408,483 
Instances, of a class (一 个 类 的 实例 )2 
Integers, very long (非常 长 的 整数 ),184,198 
Interface methods (方法 接口 )2-3,10-12 
for the list class (列表 类 的 ).207-211 
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for the queue class (队列 类 的 ),255-257 
for the stack class (堆栈 类 的 ),274-275 
for the vector class ( 癌 量 类 的 ),166-174 
int variables ( 整 型 变量 ) 
casting to char (转换 成 字符 型 ),86,641 
unsigned (无 符号 的 ),85,136,170,183,242,633-635,640,644 
Intractable problems ( 株 于 的 问题 ),80-81 
isValid method (isValid7j 23;) 2,7 29 
Iterative binary search, in recursion (X EHTE dd, 递归 
的 ),134 
Iterative functions (1X: fC Ea 42),98 
Iterative maze search, with queues (使 用 队列 的 迭代 迷宫 搜 
#) 304-305 
Iterative version, of the Towers of Hanoi game (1X SHER 
HIE TEAR 4S) 154-156 
Iterator class (:2:f 28 2K),113 
in the BinSearchTree class (在 BinSearchTree 类 中 ),327-329 
in container classes (在 容器 类 中 ),50-52 
Iterator-equality tests (3X £C 28 SE Is] PEWMÍTA),58 
Iterator interfaces, in lists (GE ZH AIIA EA HE) 211-213 
Iterator operators, defining, in container classes (Zt # 2& + yk 
代 器 运算 符 的 定义 ),52 
Iterators GER ),49 60,571-578 
bidirectional (3X fa] 7) ,206 
in BinSearchTree (在 折 半 查找 树 中 ),342-345 
breadth-first (广度 优先 ),571-574 
in container classes (在 容器 类 中 ),48-50 
depth-first (深度 优先 ),574 
in graph algorithms (在 图 算法 中 ),571-578 
hint (提示 ),431 
in lists (在 列表 中 ),225 
random-access (随机 存 取 ),478 
start(start 和 迭代 器 ),197 
vector (后 量 ),174-176 


Keywords( 关 键 字 ) 
class( 类 ),14,45 
const( 常 量 ),14 
friend( 友 元 )26 
inline(fK A.),55 
operator( 运 算 符 ),25 
public,14 
template( B Ez ),45,55 
virtual(:f2),650 
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Knight's tour problem( G AJ ita P; [n] BY) 158-161 


L 
Labs( 实 验 ) 
average height of a BinSearchTree( 折 半 查 找 树 的 平均 高 
度 ),345 


call to erase( 调 用 erase),421 
Company project(Company 项 目 ),17 
converting from infix to postfix (ph ZUR Ph y e; $8) 291 
drivers(Ult zh 2&),72 
dynamic-variable assignments versus pointer-variable 
assignments( 动 态 变量 赋值 与 指针 变量 赋值 对 比 ),40 
Fibonacci numbers(A3E iE 44324), 102 
function objects( ER 2) 364 
generic algorithms( 通 用 型 算法 ),58 
Hewlett-Packard’s deque class, details of( 惠 普 的 双 端 队列 
的 详细 资料 ),198 
inheritance, details of 继承 的 详细 资料 ).23 
iterative binary search( 选 代 折 半 查 拷 ),134 
iterator operators, defining(4z Mik i A) 52 
iterators(3X: tt 3 ),225 
list class, implementation details for( 链 表 类 的 实现 细 
35)224 
map ciasses( 映 射 类 ),431 
multimap classes( 多 映射 类 )431 . 
multiset classes( 多 集合 类 ),427 
overloading operator=( 重 载运 算 符 =),54 
overloading operator= and operator >>( 重 载运 算 符 = 和 运 
算 符 >>),27 en 
pointer-variable assignments versus dynamic-variable 
assignments( #5 t E BEISC[É 55 2) ds a BBE At EL) AO 
priority queues, incorporating fairness in( 优 先 队 列 的 公平 
合并 ),454 
randomizing( 随 机 化 ),274 
a red-black tree insertion( 红 墨 树 的 插入 )408 
run-times for sorting algorithms( 排 序 算法 的 运行 时 间 ),500 
set classes( 集 合 类 )427 © | 
timing a hash_map( 计 时 一 个 hash_map) 5339 
timing and randomness( 计 时 和 随机 ).86 — 
timing the sequence containers( 计 时 顺序 容器 ).224 
traveling salesperson problem( 货 郎 担 问 题 ).504- 
vector class, implementation details for( 同 量 类 的 实现 细 
节 ),184 B 
very long int class ,expanding(#” JR very. long int3&),190 
Late binding( 迟 连接 ),649-650 
Laws( 定 理 )。 参阅 Corollaries;Principles:Rules 





Moore’s( 摩 尔 定理 ),63 
Universal Array-Pointer( 通 用 数组 指针 定理 ),40 

least method(least 方 法 ),189 

Leaves( 树 叶 ),308 
deleted node as( 删 除 叶 节 点 ),409-421 
minimum number of( 最 小 数量 ),318 

Left child( 左 子女 ),310 

Left rotation( 左 旋转 ),354-356,384 

Length of sequence( 序 列 长 度 ),620 

Lexicographic order( 词 典 顺 序 ),144 

Life cycle, of software development (软件 开发 生命 周期 )， 
64 

Line editor application({7 nt 2X hy FA) 228-240 
design of the Editor class(Editor 类 的 设计 ),232-234 
implementation of the Editor class(Editor 类 的 实现 ).234- 
240 

Linked class( 链 式 类 ),44-48 
expansion of(-…… 的 扩展 ),91 

Linked container( 链 式 容 器 类 ),48-49 

Linked lists( 链 表 ),206,S22 

Linked structures, in container classes( 容 器 类 的 链 式 结 构 )， 
44-48 

LinkedDriver class(LinkedDriver 类 ),91 

List application, a line editor( 链 表 的 应 用 ,一 个 行 编辑 
ax ) 228-240 244-251 

List methods( 链 表 的 方法 ).208 

Lists( 链 表 )205-251 
alternative implementations of the list class( 链 表 类 的 另 -- 
种 实现 ),226-228 | 
an alternate design and implementation of the list class( 链 
表 类 的 一 个 候选 设计 和 实现 ),251 
differences between list methods and vector or deque 
methods( 链 表 方 法 和 向 量 或 双 端 队列 方法 之 间 的 区 别 )， 
213-214 
fields and implementation of the list class( 链 表 类 的 字段 
及 实现 ),214-221 
iterator interfaces( 返 代 器 接口 )211-213 
iterators in(……: 中 的 迭代 器 ),.225 
method interfaces for the list class( 链 表 类 的 方法 接 
H).207-211 
storage of list nodes( 链 表 节 点 的 存储 ),.221-224 
timing the sequence containers( 计 时 上 顺序 容器 ),224 

Load factors( 加 载 因子 ),529 

Logarithms( 对 数 ),621-622 
base of(……: 的 底数 ),622 
natural( 自 然 对 数 ),622 














Æ 3l 


M 


make heap,486-487 
makesMoreThan method(makeMoreThanJ; i3;),14,25 
Map arrays(AR HY By 28).193 
Map class(#h $f 2%) 427-431 
Maps(BR At) ,620 
Mathematical background (AK ^E: 1$ &),619-632 
functions and sequences( 国 数 和 序列 ).619-620 
induction and recursion( 归 纳 和 递归 ),.630-631] 
logarithms(*{ 4x) ,62 1-622 
mathematical induction (Z^ V4 Ay) 623-631 
sums and products( # JA A 3&),620-621 
Mathematical Induction, Principle of( 数 学 归纳 法 的 原 
F8),315,623-630 
Mathematical models( 数 学 模型 ),263 
Matrix, transition( 转 换 知 阵 ),289-290 
Maze searching (s& zx #8 ¥),152 
iterative, with queues({# HBA 715% ©) 304-305 
Mean arrival time(*? 35 Sl jABY B] ),272 
Member selection operator( sk H 选择 运算 符 ),37 
Memory leaks P 3i ),40,297 
Merge sort( 归 并 排序 ),487-493 
analysis of(------ 的 分 析 ),492-493 
example of(-……- 的 示例 ),490-492 
Messages( 消 息 ),2 | 
decoding, with priority queues( 使 用 优先 队列 解码 ),473- 
475 
Method declarations( 方 法 声明 ),2 
Method identifiers ,readInto( 方 法 标识 符 readinto),25 
Method interfaces( 方 法 接口 )2-3,10 
for the list class( 链 表 类 和 的),207-211 
in program design( 在 程序 设计 中 ).67 
for the queue class(BA Fi] 2699) 255-257 - 
for the stack class( HEAR 3H), 274-275 
for the vector class(]8] ft 26 AJ) ,166-174 
Methods( 方 法 ),2。 参 阅 Insert method 
adjustPath,368-370 
CarWash, analysis of(CarWash 方 法 的 分 析 ),272 
command check,232,235 
Company,17 
compare 383 
delete_command ,236-237 
deleteLink 337-341 349 B 
edge-related, implementation of( 55 2 48 3: 09 HNK 
Bl) 594-596 
equalTo,29 
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erase 349 388-389 
exponential-time,80 
find,351 
fixAfterInsertion, in AVL trees(AVL 树 中 的 fixAfterInser- 
tion),367-377 
generateInitialState,116 
getCopyOf,11,14,23 
get minimum, spanning tree,599-60] | 
get_shortest_path,601-603 
global implementation of(global 和 的 实现 ),596-599 
helper( 辅 助 方法 ),189 
insert, in AVL trees(AVL 树 中 的 insert 方 法 ),377-380 
isValid,2,7,29 
least,189 
list,208 
makesMoreThan,14,25 
overriding( 方 法 的 覆盖 ),18 
parse ,234 
polynomial-time( 多 项 式 时 间 方 法 ),80 
pop back,91,169,220-221,226 
pop. front,52-53,91,191,194-195,220-221,260.305 
protected( 受 保护 方法 ),269 
push_back,i74,179-180,194,200,219-221,223,260-261,305 
push_front,48-49 60,191,198 219-221 223 
recursive, in binary search trees( 折 半 查 找 树 中 的 递 
13),334-342 
tryToSolve,115-116,124,283,304 
virtual( 虚 方法 ).649 

Method validation, in program implementation( 程 序 实 现 中 
的 方法 验证 ),71-72 

Minimum spanning tree, generating with graph algorithms( H 
图 算法 产生 的 最 小 生成 树 ),579-584 

Moore's Law( 摩 尔 定理 ),63 

Multimap class( 多 映射 类 ).431 

Multiple inheritance( 多 重 继承 ),24 

Multiset class( & E 4 26) ,427 

myDate object(myDatex} $&),3 
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Natural logarithms( E] £&*]180,622. . 
Neighbors(4[/5),565 
Network class(Hi]£& 3&),588-607 
alternative design and implementation of(…… 的 另 一 种 设 
计 和 实现 ),605-607 
developing( 开 发 ),588 
fields in(:-- --- 中 的 字段 ),591-593 
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get minimum, spanning. tree method( 最 小 生成 树 方 
法 ),599-601] 
get shortest. path method( 最 短路 方法 ),601-603 
implementation of(-::::: E57 SEB) 593-594 
implementation of edge-related methods in(edge-related 7; 
法 的 实现 ),594-596 
implementation of global methods in(global 方 法 的 实 
现 ),596-599 
time estimates for the network methods( 网 络 方法 的 时 间 
花费 估算 ),604 
traveling salesperson problem( EBH in] Bi) ,604 
Networks( #5) ,563-617 
backtracking through( jbl 85588 xt 2%) ,607-610,615-617 
completing the adjacency-matrix implementation(5z X& $p 
ZERE SEB) 614 
dense( ## 42.) 607 
and directed graphs( ftf m] F),567-568 
finding shortest path through(33- 1X Ek 40 ii P&),584-587 
trees in(-……: 中 的 树 ),568-569 
and undirected graphs( 和 无 癌 图 ),564-566 
new operator(new 运 算 符 ),36-37,40-41,219 
Nodes( 节 点 ),46-48 
deleted{ 删 除 ),409-421 
header(34.),215 
list, storage of 链表 存储 ).221-224 
Nonmember functions, in string class( 字 符 串 类 的 非 成 员 函 
数 ),635-638 
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Object fields( 对 象 字段 ),9 
Objects( 对 象 ).3-6 

calling( 调 用 ),3 

function, in AVL trees(AVL 树 中 的 函数 )361-364 

OperatorStack,292-294 

Out-of-scope( 超 出 作用 域 ),53 
Open-address hashing( 开 放 地 址 散 列 ),540-557 

analysis of(....… 的 分 析 ),554-557 

double hashing( 双 散 列 },550-554 

erase method(erase 7j #:),543-548 

primary clustering( XE R 48) ,549-550 
Open-Closed Principle(JTJ& — 封闭 原理 ),18 
operator!=( 运 算 符 !=),49,58,251,327,519 
operatorO( 运 算 符 ()),362-363,399-400,423,430,441,522 
operator*( 运 算 符 *),49,58,251,327,343,519,599 
operator+(jz B FF+),187-190,198 
operator--- (iz: 3.13 ++),49,5 158,157,251 ,327 342,519 ,536- 


537,573,577 598 
operator<(Ga $5.11 <),1 26,325 362 364 387 400,478 493 
operator««(z: A 44 <<) ,24,26,187,190,464 
overloading( X& 4X) 27 
operator«?(3z: BF <?) 363 
operator=( 运 算 符 =),54,62 
overloading( 重 载 ),27,54 
operator= =( 运 算 符 = =),49,58,62,326-327,343-344,518- 
519,537,599 
operator» GZ A FF>),25 363 462,592 600 
overloading( Œ 4%) ,27 
operator>>Gz BFF >>) ,24-25 187,238,650 
overloading( dfi #%),27 
operator[ ]( 运 算 符 [ 1),40 44,174,176,205 213,427,430, 
518,535,644 
operator--(1z: Fi Ff--) 61 327 433 
operator::Ga Fi F4::) 588 
Operators(z 4 71) 
conditional( 4& lf) ,1 83 
delete HBR) ,40-41,52 
dereference( fi 5 | FH),37 
dereference-and-select( fi 5 | FA AIEEE) 37 
member selection( Ax 515 #E),37 
new,36-37,40-41,219 
overloading(t& 4%) ,25-27 54 
postincrement(/r; J]l) 211 
preincrement( 前 加 ).211 
scope-resolution( 作 用 域 解析 ),16 
in string class( 在 字符 串 类 中 ),635 
operatorStack objects(operatorStack 对象 ),292-294 
out-of-scope objects( 超 出 作用 域 的 对 象 ),53 
Overloading operator=( 重 载运 算 符 =),27 
in container ciasses( 在 容器 类 中 ),54 
Overloading operator>>( 重 载运 算 符 >>).27 
Overriding methods( fii 3£ 75 13:),18 


P 


Palindromes( {E} 3¢),149 

Parameters(# 3) 
Allocator(4} Bd 23),165 
constant reference(# & 5 | FH),14 
reference(5 | H),38-39 
template(f& £x ),45 

Parents( 父 节点 ),310 

Parse method(parse 方 法 ),234 
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Partitioning, in Quick Sort( 快 速 排序 的 分 割 ),494-497 

Path length, external, for binary trees( 二 叉 树 的 外 部 路 径 长 
度 ),317-318 

Path Rule(£& 4H ill) 392-393 ,410,413,418-419,433 

Paths( 路 径 ) 310, 392, 565 
cycles in( [E] $ ),566 
length of( 长 度 ),566 

Performance specifications( 性 能 规格 说 明 ),81 

Permutations, estimating time and space requirements for 
generating( 佑 算 生 成 置换 的 时 间 代 价 和 存储 代价 ),142- 
144 

Pointer fields( 指 针 字 段 ),39 

Pointer-variable assignments, versus dynamic-variable 
assignments( 指 针 变量 赋值 与 动态 变量 赋值 的 对 比 ),40 

Pointer variables( 指 针 变 量 ),36 

Pointers( 指 针 ),36-41 
arrays and( 数 组 和 ),39-40 
deallocation of dynamic variables( 动 态 变量 的 存储 单元 释 
放 ),40-41 
the heap versus the stack( 堆 和 堆栈 的 对 比 ),37-38 
reference parameters( 引 用 参数 ),38-39 
void(*3),122-123 | 

Poisson distribution( 泊 松 分 布 ),272 

Polymorphism( & 2 #E),647-650 
dynamic binding(z) jE £2),649-650 
importance of(------ 的 重要 性 ),648-649 

Polynomial-time method( 多 项 式 时 间 方 法 ).80 

pop_back method(pop_back 方 法 ),91 ,169,220-221 226 

pop. front method(pop_front Fy 2) ,91,191,194-195,220- 
221,260,305 
in container classes( 在 容器 类 中 ),52-53 

pop_heap,445,448-452 486 

Postconditions( 后 置 条 件 ),2 

Postfix(/ri£&) 
converting from in 有 x( 中 缀 转换 成 后 缀 ),291 
notation for( 表 示 法 ),286-289 296-297 

Postincrement operators( 后 加 运算 符 ),211 

postOrder traversal, left-right-root( 左 - 右 - 根 ,后 序 遍历 ),320- 
321 

Preconditions(Bij B. 4& 44) 2-3 

Prefix, notation for(Bi[ £i X ACHE) 292-295 

Prefix-free encoding( JC Bi[ £8 43) 456 

Preincrement operators( 前 加 运算 符 ),211 

preOrder traversal, root-left-right( 根 - 左 - 右 ,前 序 遍 历 ),321- 
322 

Prepending( 添 加 ),466 

Principles( 原 理 )。 参 阅 Corollaries:Laws:Rules 


* 


Abstraction( 抽 象 ).64 
Data Abstraction( 数 据 抽 象 ).7-8.27-28.48-49.82 
Information Hiding(fz E a 38) 28 
Mathematical Induction( 3 50-129) ,3 15 623-630 
Open-Closed(JFJ& — 封闭),18 
Priority queue application, Huffman codes((J, /GEA Fl ez FALE 
夫 昌 编码 ),456-468 
priority queue class(priority_queue 类 ),440-443 
alternative designs and implementations of(--:--- 的 另 一 种 
设计 与 实现 ),454-455 
fields and implementation of(--- --- 的 字段 与 实现 ),443-444 
Priority queues {RÆ [BÀ 71[),439-475 
decoding a message( 解 码 一 个 消息 ),473-475 
and heaps( 和 堆 ),444-454 
incorporating fairness in( 公 平 合并 ),454 
private fields(private 字 段 ),15,18-19 423 
private level of protection(private 级 保护 ),15,18-20,28 
Problem analysis([R] Bi 4) #7) 64-65 
system tests( 3s £j illl i.) 66 
Problems, intractable(&& FAJ [0] Ej) ,80-81 
Production programs( 成 品 程序 ).87 
Products( 累 乘 ).620-621 —— 
Program design( 程 序 设 计 ).67-71 
dependency diagrams(f& $X # FA),67-7 1 
method interfaces and fields( 方 法 接口 和 字段 ).67 
for the simulated car wash( 洗 车 处 仿真 ),266-268 
Program implementation( 程 序 实现 ),71-87 
Big-O notation in( 大 0 表示 法 ).74-77 
casting in( 强 制 转换 ),86-87 
drivers in( 3K z) 2%) ,72 
estimating the efficiency of methods( 估 算 方 法 的 效率 ).74 
feasibility of correctness( 正 确 性 实现 的 可 行 性 ),73 
getting Big-O estimates quickly( 快 速 获取 大 O 估 算 ).77-81 
method validation in( 方 法 验证 ),.71-72 
randomness in( 随 机 性 ),84-86 
run-time analysis of( 运 行 时 间 分 析 ),83-84 
timing and randomness in( 计 时 与 随机 性 ),86 
trade-offs in( 平 衡 折 中 ),81-83 
Program maintenance( 程 序 维护 ),87-88 
Programming projects( 编 程 项 目 ) 
backtracking through a network( 回 湖 通过 一 个 网 络 ),615- 
617 
BinSearchTree class, alternative implementation 
of(BinSearchTree 类 的 另 一 种 实现 ),350-351 
building a concordance( 创 建 一 个 词汇 索引 ),437-438 
car wash simulation, extending( 扩 展 洗车 仿真 ),298-300 
completing the adjacency-matrix implementation( 完 成 邻 
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BOBIEITJ3:80,614 
decoding a message( 解 码 一 个 消息 ),473-475 
deque class, alternative implementation of(deque 类 的 另 一 
种 实现 ).204 
Editor class, extending( 扩 展 Editor 类 ),244-251 
ei ght-queens Problem( 八 皇后 问题 ),156-158 
erase method in the AVLTree class(AVLTree2K fjerase 7j 
法 ),388-389 
evaluating a condition( 求 一 个 条 件 的 值 ),300-304 
iterative maze search(X {CHITA zx 18 3) 304-305 
iterative version of Towers of Hanoi game( 汉 诺 塔 游戏 的 
BRACE AS) 154-156 
knight's tour( £583 H7),158-161 
Linked class(Linked2&) 
expansion of(…… 的 扩充 ),91 
extending( 扩 展 ),62 
list class, alternate design and implementation of(List 类 的 
男 一 种 设计 和 实现 ),251 
queue class, alternate design of(queue 类 的 另 一 个 设 
it),305 
run-time comparison of chaining and double hashing in 
building a symbol table( 链 式 和 双 散 列 在 构造 一 个 符号 表 
中 的 运行 时 间 比 较 ),561 
Sequence class(Sequence 类 ),33 
simple thesaurus( Rj Hf. & Jl.) 436-437 
sorting a file( 排 序 一 个 文件 },509-511 
SpellChecker project, enhancing( 改 进 的 SpellChecker 项 
H),389-390 
very, long int class, extending(very_long_int 类 的 扩展 ),203- 
204 
Programs( 程 序 ) 
_production( 成 品 ).87 
robust({i£:H-),65 
protected access(protectedijj[n]),18-20 . 
protected fields(protected £ E2),26 
protected methods(protected 7; jJ:) 269 
protection(f& FF) 
private level of(privateZi fJ),15,18-20,26,28 
protected level of(protected£& [/7),19-20,26-28 216,332,487 
public level of(public££ /]),16,20,26,28,184,216 
public,20 
public constructors(public 构 造 器 ),51 
public fields(public 字 7 段 ),26,28 
public level of protection(public 级 保护 ),16,20,184.216 
in Nodes( 在 Nodes 中 的 ),46-48 
push back method(push_back 方 法 ),174,179-180,187,194， 
200,219-221,223,260,305 


push front method(push, front 7j 75;),48-49,60,191,198,219- 
221,223 
push_heap,445-448 450-45 1,453 


Q 


Queue application, a simulated car wash( 队 列 应 用 ,一 个 仿真 
洗车 程序 ),264-274,298-300 

Queue class( 队 列 类 ) 
alternate design of( 男 一 个 设计 ),305 
method interfaces for( 方 法 接口 ),255-257 
using( 使 用 ),257-258 

Queues(BA FJ) 254-261 
computer simulation with(i+# EL [Jj EL) 261-264 
container adaptors in( Zt 25 td & ),259-260 
a contiguous design for( 一 个 接近 的 设计 ),260-261 
evaluating a condition with( 求 一 个 条 件 的 值 ),300-304 
iterative maze search with (CB vk zx 48 3&8) 304-305 
priority in( 优 先 级 ),439-475 
and stacks{ 和 堆栈 ),274-277 

Quick Sort( 快 速 排 序 ),493-500 
analysis of …… 的 分析).497-499 
example of partitioning(4> 75 (9]) 494-497 
the threshold(]&][Éi ) 499-500 

Quotient-offset collison handler( 商 偏 移 冲 突 处 理 器 ),550 


R 


Radix Sort( 基 数 排序 ),506-508 
Random access( 随 机 存 取 },163,462 
Random-access iterators( iG HLI HU A 2 ),478 
Randomizing( 随 机 化 ) 
in program implementation( 在 程序 实现 中 ),84-86 
in the simulated car wash( 在 仿真 洗车 实现 中 ),272-274 
Random number generator( 随 机 数 生 成 器 ),84-85 
Random numbers( 随 机 数 ),84 
rb tree class(rb_tree 类 ) 
Hewlett-Packard(3& 3&if]) 399 
insert method in(i A Fy 23:) 399-408 483 
Reachable vertices( 可 达 的 顶点 ),571 
readInto call(readInto 调 用 ),11,650 
readInto method identifier(readInto 方 法 标识 符 ),25 
Recursion( 递 归 ),93-161 
backtracking( 回 济 ),112-125 
binary search( 折 半 查 找 ),12S-135 
cost of 代价 ),145-146 
decimal-to-binary( 十 进 制 到 二 进 制 的 转换 ),99-102 
eight-queens problem( 八 皇后 问题 ),156-158 
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execution frames( 运 行 结构 框架 ),96-99 
factorials([/] #€) 94-99 
Fibonacci numbers(AE k 4432 Br) 102 
generating permutations( 生 成 置换 ),135-144 
implementation of(…… 的 实现 ),277-285 
indirect( 间 接 ),144-145 | 
infinite( 75 73 ),96 
iterative binary search(x& f rb dz $x),134 
knight’s tour problem( BPA 5 [n] 88] ),158-161 
mathematical(Z& ^£ [1] ),630-631 
Towers of Hanoi game(iX 1535 1E RK), 103-111 154-156 
Recursion application, a maze( 递 归 应 用 ,一 个 迷宫 ),117-125 
Recursive functions( 递 归 国 数 ),145 
Recursive methods, in binary search trees( 折 半 查 找 树 的 递归 
方法 ).334-342 
Red-black tree application spell-checker revisited( 红 黑 树 的 
应 用 ,再 次 讨论 拼写 检查 器 )425-431 
Red-black trees( 红 黑 树 ),391-438 
call to erase in which all four cases apply( 四 种 情况 下 erase 
的 调用 ),421 
erase method(erase 方 法 ),408-421 
height of a red-black tree( 红 黑 树 的 高 度 ),394-399 
Hewlett-Packard’s rb_tree class( 惠 普 和 的 rb_tree 类 ),399 
insert method in the rb tree class(rb_tree 类 中 的 插入 方 
13:),399-408 
red-black tree insertion with all three cases( 三 种 情况 下 的 
红 黑 树 插 入 ),408 
in searching( 搜 索 ),517 
Standard Template Library’s associative containers( 标 准 模 
板 库 的 关联 容器 ),422-425 
Red Rule( 红 色 规 则 ),392-393,403,418-419 
Reference parameters, for pointers( 引 用 参数 ,指针 ),38-39 
Reserved words( 保 留 字 ) 
explicit 225 
public 20 
Responsibilities(HH 9f),2 
Return statement(& [n] j& 4) ,430 
Reusable components, writing( 编 写 可 复 用 软件 组 件 ),17-18 
Right chijld( 右 子女 )310 
Right rotation, 384 
Robust programs( 健 壮 的 程序 ) 6 65 
Root items( 根 项 ),.568， 
Rotations, in AVL trees(AVL 树 的 旋转 ),354-358,384-386 
Rules( 规 则 )。 参 疝 Corollaries; Laws; Principles 
Path($8 4%) 392-393 ,410,413,418-419,433 
Red(£[6&),392-393,403-404,418-419 
Splitting(4> 21),78 
Subclass Substitution(-T- 35€ $k 1f) 23 


Run-time analysis(iz (114 |H] 4) 97),83-84 
of chaining and double hashing in building a symbol 
table( 在 构造 一 个 符号 表 中 的 链 式 与 双 散 列 ).561 
of program implementation( 程 序 实现 ),83-84 

Run-times, for sorting algorithms( 排 序 算法 的 运行 时 间 ),500 


S 


Salesperson problem( f BBA [a] Bl) 604 
Sample function; il E RX) 28 1-282 
Scope-resolution operator( 作 用 域 解 析 运 算 符 ),16 
Searching( 查 找 ),513-561。 参 阅 Maze searching 
binary ($f2#),126,515-517 
depth-first( 深 度 优先 ),322 
framework to analyze( 分 析 查 找 的 框架 )S14 
red-black trees in( 红 黑 树 ).S17 
sequential( Mil -),125 514-515 
Second component( 第 二 成 分 ),619 
Sequence class(Sequence 类 ),33 
Sequence containers, timing( 计 时 顺序 容器 ),224 
Sequences( 序 列 ) 
length of( 长 度 ),620 
mathematical( 数 学 ),619-620 
Sequential searching( Mil FF # 1€ ),125,5 14-515 
Set application( 集 合 应 用 ),425-431 | 
building a concordance( 构 造 一 个 词汇 索引 ),437-438 
map class( 有 映射 类 ),427-431 | 
multimap class( 多 映射 类 ),431 
multiset class( 多 集合 类 ),427 
a simple thesaurus( 一 个 简单 的 辞典 ),436-437 
Set class( 集 合 类 ),427 
the Standard Template Library's associative container( 标 准 
模板 库 的 关联 容器 ),422-425 
Sets( 集 合 ),619 
Shortest path through a network, finding with graph 
algorithms( 使 用 图 算法 ,寻找 通过 网 络 的 最 短路 ),584-587 
SimpleClass class(SimpleClass 类 ),30-32 
Simulated car wash( 洗 车 仿真 ),264-274,298-300 
Smallest upper bound, in Big-O notation( 大 OO 表示 法 的 最 小 
上 界 ),76 | 
Software engineering(4k + T #2) ,63-91 
Big-O notation(KO# aA?) 74-77 
casting (36 4/48 eh) 86-87 
dependency diagrams( 依 赖 关系 图 ),67-71 
drivers( 驱 动 器 ),72 
estimating the efficiency of methods( 估 算 方法 的 效率 ).74 
further expansion of Linked class(Linked 类 的 进一步 扩 
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充 ),91 
getting Big-O estimates quickly( 快 速 大 0 估算 ),77-81 
is correctness feasible?(]E fflyPE 31:34 HJ n] £7 93) 73 
method interfaces and fields( 方 法 接口 和 字段 ).67 
method validation( 方 法 验证 ),71-72 
problem analysis([8] 88 2) P1) ,64-65 
program design( 程 序 设 计 ),67-71 
program implementation( 程 序 实现 ),71-87 
program maintenance, 87-88 
randomness( BA BLTE),84-86 
run-time analysis(jz 47 #f iB] 4>- #7 ),83-84 
software developmental life cycle( 软 件 开发 生命 周期 ),64 
system tests( Xs £f dili ),66 
timing and randomness( 计 时 和 随机 性 ),86 
trade-off s( +7 fj dir rH) ,8 1-83 
writing reusable components( 4 £5 ef 4d Fk 44 (4), 17-18 
Sort algorithms( 4 FF A) ,500-501 
sort heap,486-487 
Sorting(fEFF),477-511 
divide and conquer algorithms(4* 768 2;) ,500 
fast sorts( 快 速 排序 ),483-500 
of files( 交 件 ),309-511 
Heap Sort( 堆 排序 ),485-487 
Insertion Sort( 插 入 排序 ),478-481 
Merge Sort( 归 并 排序 ),487-493 
Quick Sort( 快 速 排序 ),493-500 
run-times for sorting algorithms(HEPE E 2893s Hit 
间 ),.500 
speed of( 速 度 ),481-483 
stable( 稳 定性 ),478 
Tree Sort( 树 排序 ) ,483-485 
Source Code link( 源 代码 连接 ),7 
Source files( 源 文件 ),15 
Spanning tree( 生 成 树 ),580 
generating a minimum( 求 出 最 小 生成 树 )579-584 — 
Spell-checker project( 拼 写 检查 项 目 ),380-383,425-431 
building a concordance( 构 造 一 个 辞典 ),437-438 
enhancing( 改 进 的 ),389-390 | 
map class(#R- Ff 2&),427-431 
multimap class( 多 映射 类 ),431 
multiset class( 多 集合 类 ),427 
set class( 集 合 类 ),427 
a simple thesaurus( 一 个 简单 的 辞典 ).436-437 
Splitting, Rule of 分 裂 规 则 ),78 
Stable sorting( 稳 定 排序 )478 
Stack application( 堆 栈 应 用 ) 
converting infix to postfix( 将 中 组 转换 成 后 综 ),285-295 
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how recursion is implemented (x J4 JE An {af 实现 
的 ),96,277-285 
Stack frames( 堆 栈 帆 ),278 
Stacks( HE) 274-277 
versus heaps( 和 堆 对 比 )37-38 
method interfaces for the stack class( 堆 栈 类 的 方法 接 
口 )274-275 | 
the stack class as a container adaptor tk% EAR SB Rid 
$2.98. ),276-277 
using the stack class({# FH HE#&) 275-276 
Standard Template Library (prt f B FE), 18,164 
for container classes(zz # 2&),58-59 
deques inC Ag [A 71]),164 
set class in(4É & 2%), 422-425 
vectors in([n] &t),164 
start iterator(starti& {t 25),197 
Striling’s approximation, of factorials(Stirling'stJ[/r 3E VT 
10).453 
Storage of list nodes( 链 表 节 点 的 存储 ),221-224 
Storage structures for container classes( 容 器 类 的 存储 结 
构 ),35-62 
arrays( 数 组 ),41-42 
arrays and pointers( 数 组 和 指针 ),39-40 
container classes( 4 # 3&),42-50 
data structures and the Standard Template Library( 数 据 结 
构 和 标准 模板 库 ).58-59 
deallocation of dynamic variables( 动 态 变 量 的 存储 单元 释 
放 ),40-41 | | 
defining iterator operators Œ X. 3X (Cie BFF) S2 
design and implementation of the iterator class(X f 2$ 4 
的 设计 和 实现 ),50-52 
destructors( 析 构 器 ),53-54 
extending Linked class( 扩 展 的 Linked 类 ),62 
generic algorithms( 通 用 型 算法 ),54-58 
the heap versus the stack( 堆 和 堆栈 对 比 ),37-38 
iterators% {t 2€ ),48-50 
linked structures( 链 式 结构 ),44-48 
overloading operator=( 重 载运 算 符 =),54 
pointer fields( 指 针 字 段 ),39 
pointer-variable assignments versus dynamic-variable 
assignments (指针 变量 赋值 与 动态 变量 赋值 对 比 )40 
pointers( 指 针 ),36-41 
pop_front method(pop_front 方 法 ),52-53 
reference parameters( 引 用 参数 ),38-39 
Stream classes(7# 4S) 24 
string class(^£ f] 8 2) 633-645 
constructors( 535 2$ ),634-635 
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declaration of( Fi H),633-643 
design and implementation of( 设 计 和 实现 ),644-645 
' methods that are neither constructors nor operators( 既 不 是 

构造 器 也 不 是 运算 符 的 方法 ).638-642 
nonmember functions(4E x 51 EA BL) ,635-638 
operators( 运 算 符 ),635 | 

String processing program( F £T EB REB RFF) 642-643 

struct classes(2# #492) ,14,46,123 | 

struct objects(4§ #4 Xf 82 ),50,83,329 

Structures, linked in container classes( 容 器 类 中 的 链 式 结构 )， 
44-48 

Subclasses( 子 类 ),18 

Subclass Substitution Rule( F 2€ $k Hi Bl[) 23 

Sums( 累加 和 ),620-621 

Superclasses( 超 类 ),18 

Switch statements(Switch]& 4J),7 ,87 

Symbol tables(7#-3 2) ,291 
run-time comparison of chaining and double hashing in 
building( 构 造 过 程 中 链 式 与 双 散 列 的 运行 时 间 比 较 ),561 

Synonyms([Al] X ia]) 521 

System analysis( #4 Wr ),66 

System testing( X& £i dll i) 72 


T 


Templates( 4 ),44 
arguments(4 7c) ,44 
parameters( 2 $x) ,45 
Testing (fal ix) 
bottom-up( 自 底 向 上 ),72 
system( 系 统 ),72 
Thesaurus(§¥ $2) ,436-437 
Threshold, in Quick Sort(i@{H . ， 在 快速 排序 中 ),499-S00 
Time estimates, for network methods( 网 络 方法 的 时 间 花 费 
估算 ),604 
Time function, in run-time analysis( 运 行 时 间 分 析 中 的 time 
PRL) 83-84 
Timing( 计 时 》 
a hash_map,539 
in program implementation( 在 程序 实现 中 ),86 
sequence containers( 顺 序 窑 器 ),224 
Tokens( 记 号 ),290-291 
Towers of Hanoi game( 充 诺 塔 游戏 ),103-111,1$4-156.631 
iterative version of( 达 代 版 本 ),1$4-156 
recurrence relation in( 递 推 关 系 ),110-111 
Trade-offs, in program implementation( 程 序 实现 中 的 平衡 折 
中 ),81-83 


Transition matrix(4$ 7246 fF) 289-290 
Traveling salesperson problem( ft B[ TH (A) Bil) 604 
Traversals of a binary tree( - XÆ Aid H7),318-324 
breadthFirst( 广 度 优 先 ),322-324 
inOrder( 中 序 )318-320 
postOrder( 后 序 ),320-321 
preOrder( 前 序 ),321-322 
Tree insertion, red-black( 红 黑 树 的 插 和 人 人 ),408 
Trees(43[),568-569, HAVL trees; Binary search trees; 
Binary trees; Directed trees; Fibonacci tree; Huffman trees 
Red-black trees; Spanning trees; Two-tree; Undirected 
trees 
Tree Sort( 树 排序 ),483-485 
analysis of( 分 析 ).485 
example of( 示 例 ),484 
tree sort algorithm(tree_sort 算 法 ),483-484 
tryToSolve method(tryToSolve 方 法 ),115-116,124,283,304 
Two-tree( 二 - 树 ),311-312,318 
Type conversion, automatic( 自 动 类 型 转换 ),217 
typedef 37,256 


U 


UML( 统 一 建 模 语言 )。 参 阅 Unified Modeling Language 
Undirected graphs( X% m] É),564-566 

acyclic( FL) 566 

complete(5£ 4 ),564 

connected(1& 3 ),566 

directed(45 [u]),568 
Undirected trees( JC [8] i), 568 
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Upper bound, in Big-O notation( 大 0 表示 法 的 上 界 ).74,82 
User, contract with developer( 用 户 和 开发 者 的 合约 ),8,68 
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BI) 213-214 implementation of( 实 现 ),187-190 


Vectors( 问 量 ),165-184 Very long integers( 很 长 的 整数 ),184,198 
comparison to other containers( 与 其 他 容器 的 对 比 ),176- Virtual methods( HE 7j #2) ,649 
177 void pointer( 空 指针 ),122-123 
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184 W 
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Weighted graphs( 加 权 图 ),569 

Weights(f13.),569 

worstSpace(n),74,102 
worstTime(n),74,90,98,102,197-198,209,318,321, 


[1),166-174 
possible fields of the vector class( 向 量 类 可 能 的 字段 ),177 


in the Standard (Template Library 在 标准 模板 库 中 ),164 
Vertices(] 页 点 ),563-568 
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very_long_int class(very_long_int2&),185,198,200-202 
design of iZi+),185-187 7 


expanding( 扩 充 ),190 、 
extending( 扩 展 ),203-204 Zero-parameter constructors(0-# Br 444% # ) 9 


